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La pr6sente invention concerne la recherche et la presentation deformations pertinentes k 
l'utilisateur. 

Les sources deformation les plus varices (notamment la Presse) sur le Web utilisent 
couramment des moyens d'indexation pour seiectionner dans leurs archives ou sur le Web des 
informations traitant du m£me sujet qu'une information domtee. L' indexation de chaque 
information est faite selon les mots (mots-cie) qu'il contient ou les categories qui lui ont 6x6 
associees. Cette approche permet, au mieux, de retrouver les informations ayant un contenu trfcs 
proche. 

La presente invention a pour but d'indexer des entites d* informations selon les adresses (liens) 
des page Web qui sont pertinentes par rapport k elle. Ainsi plut6t que les informations dont le 
contenu est trfes proche (voire redondant), F invention vise k retrouver les informations nouvelles 
et r6ellement pertinentes. 

De plus, elle vise k permettre d'indexer les informations non textuelles, comme les images et les 
animations. De ce fait elle s'appliqueraparticuli^rement dans tous les domaines « de g6uts » oii il 
est difficile de caracteriser par des mots-cie Finterat qu'un internaute porte a r information 
(quand par exemple elle reprgsente une musique, un objet d'art, un plat culinaire, etc).et en 
particulier au domaine de la Presse. 

L'invention propose un precede pour permettre 1'accds par un utilisateur k des d* entites 
deformations pertinentes k partir d'une entite d' informations de depart, chaque entity 
deformations etant accessible par un identiflant unique (URI), caracterise en ce qu'il comprend 
les Stapes suivantes : 

a) prevoir au moins une entity deformations similaire, presentant un contenu similaire k celui de 
F entite de depart, et determiner V identiflant de la ou de chaque entity d* informations similaire, et 

b) determiner k partir du ou de chaque identiflant d' entite deformations similaire un ensemble 
d'un ou plusieurs identifiants d'entites d'informations pertinentes par rapport k la ou chaque 
entite deformations similaire. * 

Le proc6d6 comprend en outre Fetape suivante : 

c) permettre k l'utilisateur Facets k au moins certaines informations pertinentes k partir de leurs 
identifiants respectifs 

ainsi que F6tape suivante : 

d) k partir des identifiants d'entites deformations pertinentes et d'un ensemble domte d'entites 
d'informations suppiementaires, seiectionner les entites suppiementaires les plus similaires aux 
entites deformations pertinentes. 

De plus le procede comprend une etape supplemental de tri des entites deformations 
pertinentes par degre de pertinence. 

L' etape de tri est pr6c6d6t d'une etape de calcul d'un score de pertinence par rapport k la ou 
chaque entite deformations similaires pour chacune des entites d'informations pertinentes. 
De pr6fdrence : 

Chaque entite deformations est constituee par un fragment de page ecrite en langage de 
marquage normalise, ou par une telle page dans son ensemble et chaque identiflant est constitue 
par un identificateur uniforme de ressource (URI) du fragment ou de la page. 
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L'etape a) peut etxe r^nlisee par selection par Tutilisateur d'une ou plusieurs entites 
cT informations similaires a Tentite d' informations de depart, ou par mise en ceuvre d'un 
processus de determination automatique d' entites d' informations similaires, ou encore par mise 
en oeuvre d'un processus de determination automatique d' entiles d' informations similaires, suivie 
d'une selection par Tutilisateur d'une ou plusieurs entites d* informations similaires parmi les 
entites deformations similaires d6termin£es par ledit processus. 

L' etape b) est rfialis^e par mise en oeuvre d'un processus de determination automatique d'entites 
deformations pertinentes, qui comprend T analyse d'une structure de graphe d'identifiants 
constitute par les identifiants d'entites d' informations et par les identifiants design6s par des liens 
activables par Tutilisateur contenus dans lesdites entites cT informations. 



Le processus de determination automatique d'entites deformations pertinentes comprend les 
operations suivantes : 

bl) identifier un ensemble d'entites deformations citantes constitue par toutes les entites 
d' informations possedant un lien d6signant Tidentifiant de Tentite deformations similaire ou 
d'au moins Tune des entites d 5 informations similaires, 

b2) identifier un ensemble d* entites d'informations candidates constitue par T ensemble des 
entites deformations dont les identifiants sont designes dans d'autres liens contenus dans les 
entites d ? informations citantes, 

b3) pour chaque entite d 5 informations candidate, calculer un score de pertinence d' entite 
deformations candidate entre ladite entite deformations candidate et Tentite d' informations 
similaire ou T ensemble d' entites d'informations similaires, sur la base de l'existence, dans les 
entites deformations citantes prises individuellement, h la fois d'un lien designant Tidentifiant 
de Tentite deformations candidate et d'un lien designant Tidentifiant de Tentite d'informations 
similaire ou les entites deformations similaires, et sur la base egalement de scores de pertinence 
d' entite deformations citante affectes h chacune des entites d'informations citantes, 

b4) pour chaque entite d'informations citante, recalculer un score de pertinence d'entite 
d'informations citante sur la base de l'existence, dans Tentite deformations citante en question, 
de liens vers les entit6s deformations candidates et sur la base egalement des scores de 
pertinence d'entite deformations candidate attribuees aux entites deformations candidates k 
Tetape b3), 

b5) repeter le cas echeant Tetape b3) et le cas echeant une ou plusieurs fois Tetape b4) puis 
Tetape b3), pour toutes les entites d'informations candidates et citantes, et 

b6) determiner lesdites entites d'informations pertinentes comme etant les entites d'informations 
candidates qui presentent les meilleurs scores de pertinence d'entite deformations candidate. 

Le processus de determination automatique d' entites deformations pertinentes peut aussi 
comprendre les operations suivantes : 

bl) identifier un ensemble d'entites d'informations citees constitue par toutes les entites 
d'informations identifiees dans des liens activables contenus dans Tentite d'informations 
similaire ou au moins Tune des entites d'informations similaires, 
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b2) former un ensemble d' entites <T informations candidates constitue par 1' ensemble des autres 
entites d' informations ayant des liens activables identifiant lesdites entites cit€es, 

b3) pour chaque entite d' informations candidate, calculer un score de pertinence d*entit6 
d'informations candidate entre ladite entite d' informations candidate et 1* entite d* informations 
similaire, ou 1' ensemble d'entitts d'informations similaires, sur la base de 1' existence de liens 
activables contenus dans l'entit£ d'informations candidate et dans le ou les entites d'informations 
similaire(s) et identifiant les entites d'informations cities, et sur la base 6galement de scores de 
pertinence d' entite d'informations cit6e affectes k chacune des entites d'infonnations cities, 

b4) pour chaque entite d'informations citge, recalculer un score de pertinence d'entit6 
d' informations citte sur la base de V existence, dans 1' entite d'informations citte en question, de 
liens activables identifiant cette entite d'informations citte et contenus dans les entites 
d'informations candidates et sur la base egalement des scores de pertinence d'entite 
d'informations candidate attributes aux entites d'informations candidates k l'ttape b3), 

b5) reptter le cas echtant l'ttape b3) et le cas £ch6ant une ou plusieurs fois l'etape b4) puis 
1'etape b3)» pour toutes les entites d'informations candidates et cit6es } et 

b6) determiner lesdites entitts d'informations pertinentes comme ttant les entites d'informations 
candidates qui prtsentent les meilleurs scores de pertinence d'entite d'informations candidate. 

Le calcul de score de pertinence effectud k l'etape b3) comprend le calcul d'une plurality de 
sommes de scores de pertinence d' entites d'informations citantes, chaque somme comprenant 
uniquement les scores de pertinences des entites d'informations citantes comprenant un lien vers 
une entite d'informations donnge constitute par P entite d'informations candidate ou une entitt 
d' informations similaire. II comprend egalement le calcul d'au moins une somme de scores de 
pertinence d' entites d'informations citantes, chaque somme comprenant uniquement les scores de 
pertinence des entites d'informations citantes comprenant un lien vers l'une parmi un ensemble 
d'au moins deux entites d'informations donntes comprenant l'entit6 d'informations candidate et 
au moins une entitst d'informations similaire. 

L' entite d'informations de depart est accessible par Putilisateur et 1' etape b) comprend la prise en 
compte d'informations sptcifiques k 1'utilisateur. 

Les informations specifiques k 1'utilisateur comprennent des identifiants d'entitts d'informations 
memorises dans un historique de consultation d'entitts d'informations par 1'utilisateur. 

Le precede comprend en outre une etape de presentation k 1'utilisateur, de mani&re associ€e, d'au 
moins deux elements choisis dans le groupe comprenant : 

- une presentation de Pentitt d'informations de depart 

- un lien activable dtsignant 1' identifiant de P entite de depart ; 

- des presentations des entites d'informations pertinentes determinees k retape c) ; 

- des liens activables dtsignant les identifiants des entites d'informations pertinentes 
determinees k retape c). 

II comprend en outre la presentation k 1'utilisateur, de manifere associte, d'au moins deux 
elements choisis dans le groupe comprenant : 

- une presentation de 1* entite d'informations de depart ; 
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- un lien activable designantl'identifiantde F entite d' informations de depart ; 

- des presentations des entires d' informations supplementaires les plus similaires 
determinees h Fetape d) ; 

- des liens activables utilisant les identifiants des entitSs d' informations supplementaires 
les plus similaires determinees k Fetape d). 

Un deuxifeme objet de F invention est un precede de composition ou de modification d'un 
ensemble d' informations contenant la designation d'une entite d' informations de depart donnee, 
caracterise en ce qu'il comprend les Stapes suivantes : 

- mettre en oeuvre le precede sur ladite entite de depart pour determiner une ou plusieurs 
^entites d* informations s upplementaires les plus similaires, et 

- substituer & la designation de V entite de depart la dfeignarioib^H-flaoias lime dfis 

entites supplementaires les plus similaires. 

Ce precede est aussi caracterise en ce que r ensemble d* informations possfede une structure 
comprenant un arbre avec au moins un noeud au niveau duquel la designation d'une entite 
d' informations de depart est effectuee, et en ce qu'une mise en oeuvre du precede selon la 
revendication 3 au niveau de ce noeud comprend h I'titape b) la prise en compte d* identifiants 
d'entites d' informations pertinentes associes & au moins un noeud ancStre de ce noeud dans 
1' arbre. 

Selon un autre aspect du deuxteme objet de V invention, F invention propose un precede 
d'execution variable d'un programme d'affichage de donnees comportant des operations de 
lecture de donnees de noeuds dans une structure arborescente de donnees associee, caracterise en 
ce que la structure de donnees comprend, en association avec des nceuds dont les donnees sont 
modifiables par Futilisateur dans un mode administration, des indicateurs, et en ce que le precede 
comprend les etapes suivantes : 

- k chaque lecture d'une donnee dans le structure de donnees, determination, par le 
programme d'affichage, de la presence d'un indicateur associe, 

- en cas de presence d'un tel indicateur, affichage d* elements graphiques interactifs 
permettant a Futilisateur de manipuler la donnee associee. 

En variante, Finvention propose un precede d'execution variable d'un programme d'affichage de 
donnees comportant des operations de lecture de donnees de noeuds dans une structure 
arborescente de donnees associee, caracterise en ce que programme comprend des instructions de 
lecture et de presentation de donnees correspondant & des noeuds seiectionnes, et en ce qu'il 
comprend les etapes suivantes : 

- determiner si un paramfctre d'appel de P execution du programme d'affichage correspond 
& un mode administration, 

- dans P affirmative, h chaque lecture d'une donnee dans la structure de donnees, 
determiner par le programme d'affichage, la presence d'un indicateur associe k cette lecture, et 

- en cas de presence d'un tel indicateur, afficher des elements graphiques interactifs 
permettant & Futilisateur de manipuler la donnee associee. 

Un troisifeme objet de V invention est un precede pour determiner des scores de pertinence 
d'unites de texte telles que des phrases dans un document textuel, caracterise en ce qu'il 
comprend les etapes suivantes : 
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- decomposition du document en une pluralite" d'unites de texte, 

- selection d'au moins une unite de texte pertmente et d'unites de texte candidates, 

- determination de 1' ensemble des mots signifiants contenus dans l'unite (ou les unites) de 
texte pertinente(s) et dans chacune des unites de texte candidates, 

f*^* ?°i signifiant contenu dans ^unitf (ou les unites) de texte pertinente(s), 

" ^ f ™ lt& de ^ candidates <* ^t signifiant, pour former un groupe 
a unites ae texte citantes, * 

, , Unification des unites de texte candidates, contenant au moins un mot signifiant 
egalement cite dans les unites de texte citantes, pour former un groupe d'unites de texte co-citees, 

citations".^ 0 ^ 011 ^ de t6Xte C<MJit6eS Un SCOre de P ertinen ce en fonction desdites 

teteZZT™?f^ S ' agi i d ' Un PTOC6d6 P ° Ur determ *** des scores de pertinence d'unites 
£S suites ' S Un ^ teXtUe1 ' CaraCt6ris€ 6n Ce ^ 11 COm P rend les 

- decomposition du document en une pluralite d'unites de texte, 

- selection d'au moins une unite de texte pertinente et d'unites de texte candidates, 

texte n^SSfl^ dC r < f nsemb ! e des mots signifiants contenus dans 1'unite (ou les unites) de 
texte pertmente(s) et dans chacune des unites de texte candidates, 

_ " P our chaque mot signifiant contenu dans l'unite (ou les unites) de texte pertinente(s) 

t3£S£££? 6 t6Xte C ° mprenant CC m0t Sifinifi ^ P OUr former^toupe 

A» e ^ 1Cation des « ni tfs de texte candidates contenant au moins un mot signifiant 
egalement cite dans les unites de texte cites, pour former un groupe d'unites de texte co-citantes, 

citations.^ 6 ^ 011 ^ ^ tCXte C0 - Citantes un score de Pertinence en fonction desdites 

del^aSbE d e ^invention, on propose un precede pour determiner 
aes scores attribues a des mots ou groupes de mots contenus dans des unites de texte telles due 
des phrases dans un document textuel, caracterise en ce qu'il comprend une etape qui ^oTsiste a 

SSJST" SCOTeS PertinenCeS ^ Un!tdS dC t6Xte CO " Cit6es dans les <^ lesd^ moS £ 
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Introduction: 

Le proc£d6 selon le premier objet de 1* invention sera ctecrit (d£s le chapitre 4) dans le cadre d'une 
architecture particulifere d6crite dans les deux premiers chapitres. Cette architecture permet de 
composer des documents en important des fragments qui pr&entent Tavantage de rester tenus k 
jour. On repr^sente les donn6es en XML. 

Dans le present chapitre on pr^ffere distinguer k priori et de manifere permanente les Pigments 
XML qui joueront le rdle de fragments. L'avantage de cette approche est que les applications 
(comme par exemple les feuilles de styles ou d'autres types de programmes) qui utilisent ces 
616ments XML peuvent Stre automatiquement adapt€es pour permettre T administration (Edition 
et composition 1 ) des fragments. 

Dans le chapitre suivant on prendra au contraire une approche selon laquelle les fragments ne 
sont pas d6finis an niveau des donnees mais des applications. 

Importer des fragment, composer des fragments qui restent tenus a jour 

Rappelons qu'en XML, le contenu des sites est structure de manifcre hi6rarchique ; c'est une 
structure d'arbre. 

Dans la m6thode que nous proposons dans ce chapitre, certains des noeuds de Farbre XML sont 
explicitement sp6cifi6s comme etant des « fragments ». Les fragments sont les unites de donnees 
que Ton peut refSrencer directement et que Ton peut ainsi r&itiliser (« importer ») a diff6rents 
endroits d'un site ou mgme entre difffrents sites. 

Les r6fSrences de fragments sont mises en oeuvre de mani&re innovante. Cette mise en oeuvre 
permet de modifier la composition (en sous-fragments) des fragments import6s, les parties non 
modifies restant k jour par rapport k leurs sources. 

La figure 1 illustre cet avantage (de tenue k jour) au moyen d'un exemple : dans le « Document 
1 » le contenu du fragment import6 du « Document 2 », et contenant les paragraphes 4, 5 et 6, 
reste tenu k jour, m6me si un de ses sous-fragments (le paragraphe 6) a 6t6 modifi6 ou si un 
nouveau sous-fragment (importe du « Document 3 ») y a 6t6 insure. En effet, le « Nouveau 
Fragment », qui au d6part a 6t6 ins6r6 dans le Document 2, est automatiquement propag6 dans le 
Document 1, au bon endroit dans le fragment importe. 

Un simple attribuf pour specifier quels sont les noeuds fragments 

Pour distinguer les noeuds fragments des autres noeuds XML, il suffit de specifier un attribut 
fragment^'yes". 

Cet attribut a plusieurs rdles. En effet, il indique que 

1 . T 61£ment en question est un fragment, 

2. r61£ment parent est un « r6cipient » 

3. et que tous les elements enfants du nceud parent sont 6galement des fragments. 



1 En rfcgle gdnfrale, les termes administration, Edition et composition sont ici interchangcables. 
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En outre, 

4. le nceuri racine d'un document contenant un fragment est aussi un fragment. 
Prenons un example : 

<?xml version=LO f ?> 
<PAGE> 

<HEADING>Ceci est le titre</HEADING> 



<SOMETHTNG> 

<BLOC fragment="yes"> 
<HEADBLOC fragment="yes" >Ceci est un premier sous-titre</HEADBLOC> 
<smallbloc src= 1, imagei.jpg" 
<BiGBLOC>texte texte texte texte texte texte </BlGBLOC> 
</BLOC> 
<BLOC> 

<HEADBLOOCed estun autre sous-titre</HEADBLOC> 
<SMALLBLOC src= ,, image2 jpg'7> 

<bigbloc fragment="yes">autre texte autre texte autre texte </bigbloc> 

</BLOO 
</SOMETHING> 
<SOMETHING> 

<SOMENODE> 

. . . (fragments) 

</SOMENODE> 
</SOMETHING> 
</PAGE> 



En appliquant les rfegles mentionnees plus haut, on a implicitement (les ajouts sont en gras) 

<?xml version= , 1.0 < ?> 
<page fragment="yes"> 
<HEADING >Ceci est le titre</HEADiNG> 

<something recipienfc=:"yes"> 
<BLOC fragment="yes" recipient="yes"> 
<HEADBLOC fragment="yes">Ceci est un premier sous-titre</HEADBLOC> 
<SMALLBLOC fragment= M yes ,, src= ,, imagel jpg'7> 

<BIGBL0C fragment="yes">texte texte texte texte texte texte</BiGBLOO 
</BLOO 

<BLOC fragment="yes" recipient="yes"> 
<headbloc fragment="yes">Ceci est un autre sous-dtre<*(EADBLOC> 
<SMALLBLOC fragment="yes"src=="image2 jpg ,1 /> 

<BiGBLOC fragment="yes">autre texte autre texte autre texte</BiGBLOC> 

</bloo 
</something> 
<something> 

<somenode recipient="yes ?, > 



8 



. . . (fragments) 

</SOMENODE> 
</SOMETHING> 
</PAGE> 



Le systeme peut alors automatiquement generer des identiflants 2 , par exemple: 

<?xml version='1.0' ?> 
<PAGE fragment-Ed="456"> 
<HEADING>Ceci est le titre</HEADING> 

<SOMETHlNG recipient-id="l"> 
<BLOC fragment-id="458" recipient-id="l"> 

fragment-id='W>Ceci est un premier sous-titre</HEADBLOO 
<SMALLBLOC fragment-id='»460 ,, src="imagel.jpg"/> 
^Soc^ 00 fra gment-id=-461->texte texte texte texte texte texte</BiGBLOO 

<bloc fragment-id="462" recipient-id="l"> 
<Headbloc fragment-id=»4*3»>Ceci est un autre sous-titre</HEADBLOO 
<SMALLBLOC rragment-id="464 >, src="image2.jpg7> ~ " 

</bloc^° C> fra 8 ment - id - '465">autre texte aufre texte autre texte</BiGBLOO 

</SOMETHING> 
<SOMETHING> 
<somenode recipient-id="2"> 
... (fragments) 

</SOMENODE> 
</SOMETHING> 
</PAGE> 

Structure et generation de VArbre de Con texte 
Structure de fragments et recipients 

La structure de 1'arbre de contexte est r<5cursivement composee de fragment/sous-fraements le, 

Cette structure (en XML) est illustree ci-dessous (pour le m6me exemple) : 
<fragment id=456 state="created"> 
<base-data> 
<PAGE> 
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<HEADTNG>Ceci est le titre</HEADING> 

<S0METH1NG recipieiit-id=="r7> 
<S0METH1NG> 

<SOMENODE recipient-id="2 , 7> 

</SOMETHING> 
</PAGE> 

</base-data> 
<recipients> 

<recipient id= ,, l ,, > 

<fragment id="458 5 ' state="created"> 

<b ase data> — 

<BLOC recipient-id=^l"/> 
</base-data> 
<recipients> 

<recipieni id= f, l"> 

<fragmentid="459" state==''created"> 
<base-data> 

<HEADBLOOCeci est un premier sous-titre</HEADBLOO 
</base-data> 
</fragment> 

<fragment id="460" state="created"> 

<base-data> 
<smallbloc src= ft imagel jpg7> 

</base-data> 
</fragment> 

<fragmentid="461" state="created"> 
<base-data> 

<BiGBLOOtexte texte texte texte texte texte</BiGBLOC> 
</base-data> 
</fragment> 
</recipient> 
</recipients> 
</firagment> 

<fragment id= M 462 M state="created"> 
<base-data> 

<BLOC recipient-id="l"£> 
</base-data> 
<recipients> 

recipient id="l"> 

<fragmentid=="463" state="created"> 
<base-data> 

<HEADBLOC> Ceci est un autre sous-titre</HEADBLOO 
</base-data> 
</fragment> 
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<fragment id="464" state="created"> 

<base-data> 
<SMALLBLOC src="image2.jpg t 7> 

</base-data> 
</fragment> 

<fragment id="465" state="created"> 
<base-data> 

<BiGBLOC>autre texte autre texte autre texte</BiGBLOC> 
</base-data> 
</fragment> 
<recipient> 
</recipients> 
</fragment> 
</recipient> 
recipient id="2 M > 

<fragmentid=... state="created"> 

</fragment> 

</recipient> 
<recipients> 
</fragment> 

On remarque notamment que, entre Foment recipient SOMETHING et les sous-fragments qu'il 
contient (HEADING et BLOC), il y a une sorte d' articulation - materialisee sous la forme d'un noeud 
« recipient » - qui peut 6tre exploitee pour importer de nouveaux sous-fragments dans le m6me 
recipient. Au niveau du noeud <base-data> du fragment 456 (nceud page), cette articulation est 
representee par 1' attribut recipient-id^'T' (qui spdcifie le num&o du recipient dans ce fragment), 
tandis quMl est repr6sente par 1* element recipient id="l"> (c'est une balise et non pas un 
attribut) au niveau de ses sous-fragments. 

A 1'etape d'affichage k F6cran (ou pour n' importe quelle autre presentation & Tutilisateur), le 
fragment et ses sous-fragments sont assembles et une transformation au moyen d'une feuille de 
style en XSLT (ou au moyen d'un programme d'ordinateur ayant le m6me effet - on illustrera un 
tel programme plus loin) permet de presenter T aspect graphique final de la page 3 . 

Importation d'un fragment : creation d'un lien vers un autre fragment 

Cette structure en fragments et recipients permet d'importer des fragments et de tenir chaque 
fragment importe k jour, m6me quand un (ou plusieurs) de ses sous-fragment(s) a (ont) et6 
modifie(s) ou supprime(s)> ou encore quand un (ou plusieurs) nouveau(x) sous-fragment(s) a 
(ont) ete importe(s) au sein du fragment importe en question. 

En r6sultat d'une importation 4 d'un fragment source au sein d'un fragment destination, la 
reference du fragment source (autrement dit, le lien vers le fragment source) est inser6e sous le 



3 Noter qu'un fragment peut aussi reprfisenter directement un fragment de la page (HTML) d'origine. Dans ce cas il 
possfcde un sous-nceud « base-data » qui contient le code (HTML) du fragment d'origine. 

* (on utilise le m&ne mot « importation » qu'il s'agisse d'une importation de fragment au sein d'une page ou qu'il 
s'agisse de la creation d'un lien) 
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noeud fragment destination en tant qu'attribut «ref» d*un sous-noeud « derived-data » du 
fragment destination. La mise en csuvre de cette reference peut 6tre sous la forme d'un appel a un 
Service Web apte a retourner le fragment en question. 5 

Un lien est repr&ente en tant que fragment En effet, ce sont les feuilles de style (par exemple en 
XSLT, ou autres types de programmes) assoctes aux (ou a certains seulement des) fragments (ou 
encore une feuille de style associee au document tout entier) qui d6terminent la presentation des 
pages et determinent en particulier s'il faut presenter ou pas le fragment qui est au bout d'un 
lien. 6 

On va maintenant prendre un exemple d'un deuxifeme document duquel on va importer un 
fragment dans le premier document 




Document 2 : 

<?xml version^!. 0 1 ?> 
<page fragment-id="789"> 
<SOMETHiNG recipient-id=="l"> 
<BLOC fragment-id= ,, 790" recipient-id=' 9 3 9? > 
<HEADBLOC £ragment-id= M 79r 5 >Sous-titre du bloc externe</HEADBLOO 
<SMALLBLOC fragmenMd="792"src="image3 jpg'7> 

</BLOC> 
</SOMETHING> 
</PAGE> 



Voici Farbre de contexte qui y correspond: 

Representation interne (arbre de contexte) du Document 2 (gere par servicewebl23): 
<fragment id=789 state="created"> 
<base-data> 

<PAGE> 

<SOMETHiNG recipient-id='T7> 

</PAGE> 

</base-data> 
<recipients> 

<recipient id="l"> 

<fragment id= M 790" state= M created"> 
<base-data> 

<BLOC recipient-id=" 1 *7> 
</base-data> 
<recipients> 

<recipient id= u r> 



5 Par ailleurs, optionnellement un sous-616rnent « cache » permet de stocker provisoirement le code (HTML, ou 
XML + 6ventuellement la feuille de style) du fragment source import6 (pour am6liorer les performances dans le cas 
d'importation & partir d'un serveur distant). Ceci est partiellement d6fini plus loin. 

6 Ainsi un fragment peut Stre presents sous la forme d'un simple lien acti vable vers une autre page (dans laquelle le 
contenu du fragment est pr6sent£), ou bien le contenu du fragment peut £tre pr6sent<S directement au sein de son 
fragment parent, ou encore un extrait en est pr6sent£ avec en plus un Hen activable qui permet d'aller voir la 
presentation du fragment en entier. 
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<firagment id="791" state="created"> 
<base-data> 

<HEADBLOoSous-titre du bloc externe</HEADBLOO 
</base-data> 
</fragment> 

<fragment id="792" state="created"> 
<base-data> 

<SMALLBLOC src="image3 jpg"/> 
</base-data> 
</fragraent> 
</recipient> 
</recipients> 
</fragment> 
</recipient> 
<recipients> 
</firagment> 



Ainsi, si par exemple 1 utilisateur importe le fragment n° 790 du deuxifeme document dans le 
recipient n 1 du fragment n° 456 du premier document juste avant le fragment n° 462 et qu'il 
suppnme le fragment n° 792, on a la structure illustrde ci-dessous. 

Representation interne (arbre de conteste) du Document 1 (apres Pimportation): 

<fragment id=456 state="created M > 
<base-data> 

<PAGE> 

<HEADiNG>Ceci est le titre</HEADING> 

• * « 

<SOMETEHNG recipient-id= T7> 

<SOMETHING> 

<SOMENODE recipient-id="2"/> 
</SOMETHING> 
</PAGE> 

</base-data> 
<recipients> 

recipient id='T*> 
<fragment id="458" state="created"> 
<base-data> 

<BLOC recipient-id='T7> 
</base-data> 
<recipients> 

<recipient id='T'> 

<fragment id="459" state="created"> 
<base-data> 

<HEADBLOC>Ceci est un premier sous-titre</HEADBLOC> 
</base-data> 
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</fragment> 

<fragment id= '460" state="created M > 

<base-data> 
<SMALLBLOC src^'imagel jpg u /> 

</base-data> 
</fragment> 

<fragment id='461'° state="created'*> 
<base-data> 

<BiGBLOC>texte texte texte texte texte texte</BiGBLOC> 
</base-data> 
</fragrnent> 

</recipient> — — 

</recipients> 
</fragment> 

<fraginent id="4o6" siate="hwported ?9 > 

<derived-daia ref= M webservicel23/GetFragmeat?Id=790 M /> 
<recipiejits> 

recipient id="l"> 

<fragment id="467" state="accepted"> 
<derived-data 

ref= t, webservicel23/GetFragmeni?Id=791 M /> 
</fragment> 

<firagment id=s w 468" state="suppres$ed ,5 > 
<derived-data 

ref= ,, webservicel23/GetF^agI^ent?Id=792 t, /> 
</fragment> 
<recipient> 
</recipients> 
</fragment> 

<fragraentid="462" state="created"> 
<base-data> 

<BLOC recipient-id= T7> 
</base-data> 
<recipients> 
recipient id= u l"> 

<firagmentid=*463" state="created"> 
<base-data> 

<HEADBLOO Ceci est un autre sous-titre</HEADBLOC> 
</base-data> 
</fragment> 

<fragment id="464" state="created"> 

<base-data> 
<smallbloc src="image2 jpg"/> 

</base-data> 
</fragment> 



14 



<fragment id="465" state="created"> 
<base-data> 

<BiGBLOC>autre texte autre texte autre texte</BiGBLOO 
</base-data> 
</fragment> 
<recipient> 
</recipients> 
</fragment> 
</recipient> 
recipient id="2"> 

</recipient> 
<recipients> 
</fragment> 

La regie qui a ici €t€ appliquee est que les sous-fragments d'un fragment qui vient d'Stte imports 
^ceS^ * ^ * POUrqUOi 16 aam4ca Voeat n° 467 est a l'6tat accepte (noS 

Par la suite, si dans le document 2, un sous-fragment supplemental est ajout6, celui-ci fera 
imphcitement parue du fragment importe dans le document 1. On dit qu'il est a l'&at surz6t6 
(<< suggested >>) et quand 1'utilisateur accedera au document 2 en mode administration, il le verra 
P r6sent6 a 1 6tat « suggested » et pourra le faire passer a 1'etat « accepted » pour le valider auquel 
cas ce nouveau sous-fragment va effectivement faire partie de 1' arbre de contexte du document 1 



Structure de cache pour les fragments importes 

Comme decrit plus haul, un fragment peut etre constitue d'une reference a un autre fragment ce 
dernier se ttouvant eventuellement dans un autre ordinateur et pouvant lui meme reWncer un 
ttoisieme fragment se trouvant dans un troisieme ordinateur, et ainsi de suite, jusqu'au dernier 
fragment qui lui pomte sur une microstructure. 

En consequence, pour assembler tous les fragments recuperet au bout des chames de references 
beaucoup de communications entre machines peuvent 6tre necessaires. L'assemblage du 
document a partir de son contexte peut done 6tre relativement lourd. 

De plus, il suffit qu'une seule machine (ou logiciel serveur) dans une chaine soit en panne, ou 

*™t? I ^^T 10 !? ? r °?5 Ue ' P0ur qUe le fragment en bout de chatoe ne P^se pas 6tre 
Ssembter t61echarge de proche en proche jusqu'au document que 1' on cherche a 

GSt de Sl m °? er 6n l0Ca1 ' dans rari)re de contexte « les donn ^s « base-data » des 
fragmente extemes accedes, du moins certaines d'entre elles. On ne memorisera en general que 
les donees importers qui sont distantes (ne resident pas sur le meme site). 

Representation interne (arbre de contexte) du Document 1 (aprfcs I'importation): 

<fragment id=456 state="created"> 
<base-data> 
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</base-data> 
<recipients> 

<recipient id=" l "> 

<fiagment id="458" state="created"> 
<base-data> 

<bloc recipient-ids" l"/> 
</base-data> 
<recipients> 

<recipientid= ,, r , > 

. . . (fragments n° 459 & 461) 
</recipient> 
/recipien 
</fragment> 

<fragment id="466" state="imported"> 

<derived-data ref= ,, webservicel23/GetFragment?Id=790 ,t > 
<cached-data> 

<BLOC recipient-ids"!"^ 
</cached-data> 
</derived-data> 
<recipients> 

<recipient id="l M > 

<fragment id="467" state="accepted"> 
<derived-data 

ref= n webservicel23/GetFragment?Id=791 n > 
<cached-data> 
<HEADBLOC>Sous-titre du bloc externe</HEADBLOO 
</cached-data> 
</derived-data> 
</fragment> 

<fragment id="468" state="suppressed"> 
<derived-data 

ref= l, webservicel23/GetFragnlent?Id=792 ,, /> 
</fragment> 
<recipient> 
</recipients> 
</fragment> 

. . . (fragments n° 462 et ses sous-fragments) 
</recipient> 
recipient id="2 M > 

</recipient> 
<recipients> 
</fragment> 
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Sceller un fragment 

L'attribut « sealed » permet de « sceller » un fragment. Ainsi, un fragment ayant l'attribut 
sealed= yes indique que quand le fragment en question est importe" ailleurs, ses recipients et 
sous-fragments ne sont pas visibles (et ne peuvent done pas etre manipules) ; l'ensemble du 
tragment est vu comme un seul bloc (c' est le cas de le dire).. 

Sme^ 8 reXempIe du deuxifeme document duquel on importe un fragment dans le premier 

Document 2 : 

<?xml version=1.0' ?> 
<PAGE fragment-id="789" > 
<SOAffiTHiNG recipient-id=*T'> 
<bloc fragment-id="79(r sealed="yes" recipient-id="l M > 
<headbloc fragment-id="791">Sous-titre du bloc externe</HEADBLOO 
<smallbloc fragment-id^'TP^^^^imageaope"^ 

</BLOC> 
</SOMETHING> 
</PAGE> 

Voici 1'arbre de contexte qui y correspond: 

Representation interne du Document 2 (g6r€ par servicewebl23): 
<fragment id=789 state="created"> 
<base-data> 

<PAGE> 

<something recipient-id= ,, l ,> A> 

</t>AGE> 

<rt>ase-data> 
<recipients> 

recipient id= ,, l"> 

<fragment id="790" sealed="yes" state="created"> 
<base-data> 

<BLOC recipient-id='T7> 
</base-data> 
<recipients> 

recipient id= ,, l n > 

<ftagment id="791" state="created"> 
<base-data> 

<HEADBLOOSous-titre du bloc externe</HEADBLOC> 
</base-data> 
</fragment> 

<fragmentid="792" state="created"> 
<base-data> 

<SMallbloc src="irnage3.jpg f, /> 
</base-data> 
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</fragment> 
</recipient> 
</recipients> 
</fragment> 
</recipient> 
<recipients> 
</fragment> 

L'utilisateur -qui (comme avant) importe le fragment n° 790 du deuxfeme document dans le 
recipient n° 1 du fragment n° 456 du premier document juste avant le fragment n° 462- ne peut 
-rre mna i mni p< ^ppf4ffl«^^ n ° 79?, ca r il ne le voit pas. En effet, on a maintenant la 

structure illustrSe ci-dessous. 

Representation interne du Document 1 (apr&§ IMmportation): 

<fragment id=456 state="created"> 
<base-data> 
• ♦ » 

</base-data> 
<recipients> 

<recipient id=" 1 "> 

<fragment id="458" state="created"> 

</fragment> 

<fragment id="466" state="imported"> 

<derived-data ref= f, webservicel23/GetFragment?Id=790" /> 
</fragment> 

<fragment id="462" state="created"> 

</fragment> 
</recipient> 
^recipient id= ,, 2 ,1 > 

</recipient> 
<recipients> 
</£ragment> 

Autres representations de la structure des fragments 
Representation tiuale 

Pour la structure interne, on peut eviter de devoir crSer un arbre de contexte si on ajoute des 
attributs « fragment-ref » (associ6s aux balises). 

Representation interne duale du Document2 (webservicel23) : 

<?xml versions .0* ?> 

<PAGE fragment-id="789" state="created" > 
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<S0METHING recipient~id="l"> 
<BLOC fragment-id= '790" state="created" recipient-id='T*> 
<HEADBLOC 

fragment~id="791" state="created" >Sous-titre dubloc externe<AiEADBLOO 

<SMALLBLOC 

fragment-id="792" state="created" src="image3 jpg'7> 

</BLOO 
</SOMETHING> 
</PAGE> 

Representation interne duale du Document 1 (apres V importation): 

<?xml version=*L0 > ?> 
<PAGE fragment-id="456" state="created" > 
<HEADiNG>Ceci est le titre</HEADiNG> 

<something recipient-id="l"> 
<bloc fragment-id=="458" state="created" recipient-id='T'> 

<HEADBLOC 

fragment-id="459" state="created">Ceci est un premier sous-titre</HEADBLOO 

<SMALLBLOC 

fragment-id="460" state="created" src="imagel jpg7> 

<BIGBLOC 

ftagment-id="46r 9 state="created">texte texte texte texte textetexte</BiGBLOC> 
</BLOO 

<BLOCfragment~id="466" state^imported" recipient-id="l" 

fragment-ref= ,, webservicel23/GetFragment?Id=790 ff > 
<headbloc fragment- id="467" state="accepted M 

fragment-ref= ,l webservicel23/GetFragment?Id=791 , V> 
< SMALLBLOC fragment-id="468" state="suppressed" 

fragment-ref = ,, webservicel23/GetFragment?Id=792 f 7> 

</BLOC> 

<3LOC fragment-id=="462" state="created" recipient-id^"!'^ 

<HEADBLOC 

fragment-id="463" state="created">Ceci est un autre sous-titre</HEADBLOO 
<SMALLBLOC 

firagment-id="464" state= M created" src= M image2 jpg7> 
<BIGBLOC fragment-id="465" state="created"> 
autre texte autre texte autre texte</BlGBLOC> 

</BLOC> 
</SOMETHING> 
<SOMETHING> 

<SOMENODE recipient-id= *2"> 
(fragments) 

</SOMENODE> 
</SOMETHING> 
</PAGE> 
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De mSme on peut ajouter un attribut « cached-data » pour remplacer le sous-element de meme 
nom. 

Representation avant presentation a rutilisateur 



On doit g6nerer une representation apte h. permettre r application de la feuille de style pour 
presentation & rutilisateur. Cette representation peut avoir toutes les references dej& r&olues, 
comme ci-dessous. 

Bocument 1 (apres Piinportafcion) pr§4 a etre present^: 
<?xml version=1.0' ?> 

-^v^u^^ ftftate= »created n > 

<HEADiNG>Ceci est le titre</HEADiNG> " ~ 

<SOMETHiNG recipient-id='T*> 
<BLOC fragment-id=="458" state= w created" recipient-id='T'> 

<HEADBLOC 

fragment-id="459" $tate="created">Ceci estun premier sous-titre</HEADBLOO 
<SMALLBLOC 

fragment-id="46(T state="created" src= ,, imageljpg7> 

<BIGBLOC 

fragment-id^^l" state="created ?? >texte texte texte texte texte texte</BiGBLOC> 

</BLOO 

<BLOC fragment-id="466" state="imported" redpient-id="r 5 > 
<HEADBLOC 

fragment-id="467" state="accepted^>Sous-titre du bloc es:teme</HEADBLOO 
</BLOC> 

<BLOC fragment-id= '462" state= 9 *cre&ted" recipient-id='T'> 

<HEADBLOC 

fragment-id="463" state="created">Ceci estun autre sous-titre</HEADBLOC> 

<SMALLBLOC 

fragment-id="464" state="created" src="image2 jpg M /> 

<BIGBLOO 

fragment-id= *465" state="created">autre texte autre texte autre texte</BiGBLOO 
</bloo 

</S03WETHING> 
<SOMETHING> 

<somenode recipient-id="2"> 
... (fragments) 

</SOMENODE> 
</SOMETHlNG> 
</PAGE> 

En variante, la feuille de style (ou le programme de presentation) peut prendre en entree la 
representation duale (qui peut Stre effectivement utilis6e en interne ou g£n£r€e h. partir de l'arbre 
de contexte qui elle est utilis£e comme representation interne, ou encore h. partir d'une base de 
donnees relationnelle par exemple). 
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On evite ainsi d* avoir a disposition des feuilles de style (ou programmes de presentation) qui 
s'appliquent sur i'arbre de contexte directement. 

Composants de presentation des p&ges 
L'arfore des composants d'une gsage 

Le Document 1 doit par exemple 6tre pr6sent£ sous la forme sch&natiquement illustr£e h la figure 
2, 

Si les composants de presentation peuvent &tre cr6es de manifcre statique, leur assemblage (selon 
la figure ) pent Stre effective simplement au moyen d*un programme ayant 1' allure suivante: 

using System; 
using w ; 

using System, Web.UI .WebControls; 

namespace Lib 
{ 

public class StaticCreation : WebControl 
{ 

public StaticCreation () {} 

protected override void CreateChildControls ( ) 
{ 

Ctrl 6 _ctrl6 = new ctrl6{); 

ctrl4 _ctrl4 = new ctrl4 ( ) ; 
_ctrl4.Pos « 1; 

ctri3 _ctrl3 = new ctrl3 ( "Ceci est un premier sous-litre n ) ; 
_ctrl4 .Add (_ctrl3 ) ; 

ctrli _ctrll = new ctrll ( ) ; 
_ctr 11 . Image = ■ imagel opg " ; 
_ctrl4.Add(_ctrll) ; 

ctrl2 _ctri2 = new ctrl2 ( "texte texte texte texte texte texte ■ ) ; 

__ctrl4.Add (_ctrl2); 
_ctrl 6 . Add {_c tr 14 ) ; 

_ctrl4 = new ctrl4 ( ) ; 
_ctrl4.Pos = 2; 

_ctr!3 = new ctri3 ( * Ceci est un autre sous-titre n ) ; 
_ctrl4 .Add (_ctrl3 ) ; 

_ctrll = new ctrll (); 
_ctrll . Image = "image2.jpg"; 
_ctrl4.Add(_ctrll) ; 

_ctrl2 = new ctrl2 { "autre texte autre texte autre texte n ) ; 
_ctrl4.Add(_ctrl2) ; 
_Ctrl6.Add(_ctrl4) ; 

Controls. Add (_ctr!6) ; 

} 

> 
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}; 

Ici Ja proprtete « pos » (position) est renseign£e pour le composant ctrI4. Les composants son! par 
exemple programmes comme suit (dans le principe) : 

public class ctrll : Control 
{ 

Image __img; 
int _algn,_pos; 

public int Pos 



get { return _pos ; } 
set { _pos = value; } 




get { return _img . imageUrl ; } 
set { _img . ImageUr 1 = value; > 



public int Align 

get { return _algn; } 
set { _algn = value; } 

protected override void CreateChildControls { ) 

if ( _algn == 0) 

_img.lmageAlign = imageAlign.Lef t; 

else 

_img.ImageAlign = imageAlign, Right ; 
Controls .Add (_img) ; 

} 

} 

Comme le composant de presentation ctrl4 a sa position en tant que valeur d'attribut, il peut 
utiliser cette information pour aligner les composants enfants comme l'indique la figure : si sa 
position est impaire, le composant enfant ctrll est cr66 en &ant align6 & gauche, sinon & droite. 

public class recipient : Control 
{ 

public ArrayList _ctrls; 

public recipient {) { __ctrls - new ArrayList () ; } 
public void Add (Control obj) 

{ 

_ctrls.Add(obj) ; 

} 

} 

public class ctrl4 : recipient 
{ 

int _pos; 

public ctrl4{) :base() { } 
public new void Add (Control obj) 
{ 

base. Add (obj) ; 

} 

public int Pos 
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{ 

get { return _pos;} 
set { _j?os = value; } 

} 

protected override void CreateChildControls ( ) 

Control obj; 
if (_ctrls .Count ==0 ) 
return; 



Table tbl; 
TableRow tr; 
TableCell td; 

tbl = new Tablet) ; 

tr = new TableRowO; 

td = new TableCell ( ) ; 

obj = (Control) _ctrls[0]; 

td. Controls. Add (obj) ; 

tr. Cells. Add(td) ; 

tbl. Rows. Add(tr) ; 

tr = new TableRow ( ) ; 
' td « new TableCell ( ) ; 
* obj = (Control) _ctrls[l]; 

( (ctrll) obj). Align = _pos%2; 

td . Controls . Add ( obj ) ; 

obj = (Control) _ctrls[2] ? 

td . Controls . Add ( obj ) ; 

tr. Cells, Add (td) ; 

tbl . Rows . Add ( tr ) ; 

Controls. Add (tbl) ; 

} 

> 



Generation dynamique de 1'arbre des composants a partir des fragments 

Nous d£crivons maintenant le cas oft les composants de presentation (dont le code source a 6t6 
d6crit dans la section prec&iente) doivent Stre cr66s dynamiquement k partir des fragments XML 
et de leurs composants de presentation correspondant (la correspondance <5tant spgcifige avec les 
composants FgmtCtrl). 

Le procede de presentation opfcre & partir des correspondances suivantes entre les fragments et les 
composants qui les pr6sentent: 

<PAGE fragment-id=:"456"> (pr<5sent<5 par) 

<BLOC fragment-id="458"> 

<hbadbloc fragment-id="459"> 

<smallbloc fragment-id="460"> 

<BIGBL0C fragment-id="461"> 
<BLOC fragment-id="462"> 

<HEADBLOC fragment-id="463"> 

<SMALLBLOC fragment-id==»464"> 

<BIGBL0C fragment-id="465"> 



-> 


(coraposant) ctrl6 




ctrl4 




ctrB 




ctrll 




ctrl2 


-> 


ctrl4 


-> 


ctrl3 


-> 


ctrll 


-> 


ctr!2 
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Comme l'illustre la figure , ctr!4 est en charge de presenter le fragment smallbloc (par le 
cZXnt S-ll) alignee a gauche quand son fragment parent (BLOC) est a une posmon .mpau-e et 
alignee a droite sinon. 

La pa-e Web source (en 1' occurrence c' est une page aspx, selon la technologie ASP.NET de 
Microsoft, marques deposfies) sera constitute de composants FgmtCtrl charges dissembler les 
composants de presentation comme specific" ci-dessus. 

Les composants FgmtCtrl ont pour role de creer dynamiquement l'arbre des composants de 
P^seSonTs fr^nents. Us sont places dans un composant PageCtrl auquel on specrfie quelle 
est la source XML. La page aspx a 1' allure suivante : 

^ Pog ,^rT aa Pr»fi*="App» N ameSpace="WebControlUbr ar y l23" Assembty="tagcontrols" %> 

<%@ Page Language="C#" Inherits="Ub.PageCtri" %> 

<html> 

<body> 

<form runat="server"> 

<App: PageCtrl Data="..\documentl.xml"> 

< A pp:FgmtCtrl 6lement="PAGE° Control="ctrl6" NameSpace=»Lib« Asm^PWebConlrols" Args=»Empty" 
runat= w server tt > 

<A P p:FgmtCtrl Element="BLOC" Control="ctrl4« NameSpace="Lib" Asm=WebControls« Args="Empty« 
runat= n server M > 

<App:PropertyMapping Name="AHgn" Value="Const : 1" Asm=WebControls» runat="server7> 
<App:FgmtCtrl Element^HEADBLOC" Control='ctr»3« NameSpace="Lib" Asm=*PWebControls'' Args=»Content» 
runat="server7> 

<A P p:FgmtOrl Element="s«ALLB..oc" Control=«ctrli» NameSpace="Ub* Asm=WebControls'' Args=-Content» 
runat="server"> 

<App:PropertyMapping Name=«Image» Value="@src" Asm^PWebControls" runat=«server7> 
</App:FgmtCtrl> 

<App : FgmtCtrl Element=« B iGBLOC» Control="ctri2" NameSpace="Lib- Asm^PWebControls" Args=»Content» 
runat= M server n /> 

</App:FgmtCtrl> 

</App:FgmtCtrl> 

</App:PageCtr!> 

</form> 
</body> 
</html> 

Args^'Empty" indique qu' aucun argument ne sera fourni au constructeur du composant en 
question. 

Args-"Content" indique que le contenu (chafne de caractfcres) de r Anient sera pass6 en 
argument au constructeur. 

L'application aspx commence par Reenter le composant PageCtrl qui lui execute le (oute) 
composant(s) FgmtCtrl de premier niveau (ceux qui n'ont pas de compos ^f^ff^^f- 
Chaque FgmtCtrl, pour tous les fragments dont le chemin correspond a la yaleur de 1 attnbut 
« Element^ cr6e une instance de composant de presentation sp6cifie par r attnbut Control, en 
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passant au constructeur les paramfetres sp6cifi£s par 1'attribut Args, et l'ajoute & la page Web en 
cours de construction. 

Les composants enfants PropertyMapping permettent ensuite de renseigner les valeurs des 
propri6t€s du composant cr66. De manifere transparente, la propri&6 Self du composant en 
question est aussi renseign6e, de manifere & ce que ce dernier connaisse Tadresse exacte du 
fragment qu'il a le r61e de presenter. 

Ensuite (voir la procedure CreateTree d^crite ci-aprfes) les autres composants, g6n€r6s par les 
autres composants FgmtCtrl, sont ajout6s au sein de leur parent. Ainsi Tarbre des composants se 
construit dynamiquement 

FgmtCtrl est mis en ceuvre de la manifere suivante (en pseudo-code) : 

FgmtCtrl : WebControi 

{ 

CreateChildControls() 
{ 

for each fragment in all xml fragments that match Tag 
{ 

parent = new ctrlXQ 
Controls.Add(parent) 

(CreateChildControisO is called automatically within parent) 
CreateTree(parent, this (the current FgmtCtrl ctrl, to access the children 
FgmtCtrls), fragment, ...) 
} 

> 

CreateTree(parent, this, fragment, .,.) 
{ 

for each FgmtCtrl Ctrl (childFgmtCtrl) which is child of this 
{ 

// inspect its given Element and control name, ... properties 
// say Element = childtag, Control = chiidctrl 

for each childfragment in all xml fragments within fragment that match childtag 
{ 

// create instance of the control chiidctrl 

child = chiidctrl CArgs evaluated if any") 

(CreateChildControlsQ is called automatically within child) 
parent.Add(child); 

if (children exist within childFgmtCtrl) 

CreateTree (child, childFgmtCtrl, childfragment,...) 
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Transformations pour permettre la maintenance 
ftflode « Administration » 

Lorsque I'utilisateur accede a la page dans un mode « Administration » (ou « Edition », ou 
encore « Manipulation », etc.), par example en cliquant sur un bouton comme illustre a la figure 
3. a, les coniposants de presentation prennent un comportement legferement different en ce sens 
quMls intercalent dans la presentation, pour chaque fragment, un ensemble de boutons et 
poignees/cibles (pour glisser-d^poser) permettant d'effectuer des manipulations sur (ou entre) les 
fragments. Ceci est illustre a la figure 3.b. 



Etats et Transitions c3es fragments 



Les fragments peuvent 6tre dans Tun des etats suivanis : - 

- cr66 (« created ») 

- importe (« imported ») 

- accept^ (« accepted ») 

- supprime (« suppressed ») 

- geie (« frozen ») 

- sugg6re (« suggested ») 

Quand un fragment est importe h partir d'un fragment source, un nouveau fragment, qui est une 
reference sur le fragment source, est cre6 k retat 'importe*. Ensuite, les sous-fragments 
coxrespondant aux sous-fragments dudit fragment source (tous les descendants) sent egalement 
cr£6s, sous forme de reference k ces derniers, a retat 'accepts par defaut et peuvent passer k 
retat 'suggere* sous Taction de Tutilisateur. 

Le comportement des fragments dans les etats 'imports et 'accepte' est ensuite presque 
identique, k ceci prfcs qu'un fragment 'accepts' peut passer k 1* etat 'suggere* puis k retat 
*supprime% tandis qu'un fragment 'importe* est supprime directement. Egalement, le 
comportement d'un fragment k l'6tat 'cree* peut Stre quasiment le m6me que celui k retat *geie\ 
Ainsi, nous ne decrirons pas retat 'cree 5 ni retat 'importe', mais seulementles etats 'accepte* et 
'geie\ 

Apres qu'un fragment (fragment destination) eut ete importe k partir d'un fragment source, les 
nouveaux sous-fragments qui par la suite sont ajoutes dans le fragment source sont implicitement 
k retat 'suggere* au sein du fragment destination. En mode administration ils sont presentes k 
l'utilisateur qui peut alors les faire passer k retat 'accepte' ou k retat 'supprime 5 . Ils ne sont pas 
presentes k V utilisateur en mode normal et il n'est pas necessaire qu'ils soient memorises au sein 
du fragment destination. Par contre, les sous-fragment qu'on a fait passer k retat 'supprime' 
doivent alors Stre memorises (au sein du fragment destination)* pour que le syst&me puisse 
distinguer les sous-fragments (supprimes) qui ne doivent pas Stre re-suggeres (en mode 
administration). 

Dans le cas oh, au sein d'un fragment destination qui est k retat 'importe' ou 'accept£\ tous les 
sous-fragments (correspondant a tous les descendants du fragment source correspondant au 
fragment destination) sont k retat 'accepte*, il n'est pas necessaire de les memoriser au sein du 
fragment destination ; un attribut « aU-accepted="yes u » associe au fragment destination suffit. 
Les sous-fragments devront gtre memorises dans toute la branche (de l'arbre XML) comprenant 
au moins un descendant qui n' est pas k retat 'accepte*. 
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Enfin, l'6tat *gel6* (Tun fragment destination correspond & une copie du fragment source 
correspondant 

L'application apte a gerer le mode administration 

La page aspx regoit le mode en tant que paramfctre (lors de son appel) et le retransmet aux 
composants FgmtCtrl (en tant que propriete statique) : 

FgmtCtrl.Mode = Request Para msPmode"]; 
Le programme aspx n'a pas beoin d'Stre modiftee. 

Composants de preseeitatSon en mode administration 

Les ajouts et modifications par rapport au code pr6sente h. la section pr£c6dente sont en gras. 

Les composants fait appel k une fonction « admiastodeDraw » apte & presenter & Putilisateur des 
moyens pour manipuler les fragments (moyens qui incluent par exemple des poign6es/cibles 
comme d6fa d£crit). 

public class ctrlmo&a : Control 
i 

bool _isfgmt=false; 

String element; 

Static String _mode= "normal " ; 

String f gmt_id; 

public ctrlmodeO {> 

public ctrlmode( String element) 

this .element = element; 

static public String Mode // received from FgmtCtrl 

get { return jaode;) 
set { _mode = value; > 

public String Element // received from FgmtCtrl 

get { return element;} 
set { element « value; } 

public bool XsFgmt // received from FgmtCtrl 

get { return _isfgmt;> 
set { _isfgmt = value; > 

public String Self // received from FgmtCtrl 

get { return fgmt_id;} 
set { fgmt__id = value; } 

public void AdminModeDrawO 

if (l_isfgmt) return; 

Label 1 = new Label ( ) ; 
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l.Taxt = element; 
svjitch (_jmode) 
{ 

case ^admin": 

SomeButtons ixag = new SomeButtons ( ) ; 

Controls. Add (img) ; 

break; 

> 

Controls-Add(l) ; 

> 

> 

public class ctrll s efcrlmode 

{ 

Image _img, — ■ 

int _algn,_pos; 

public int Pos 
{ 

get { return _pos;} 
set { _pos = value; } 

} 

public String Self 

get { return _abspath; } 
set { _abspath = value; } 

} 

public String Image 

{ n , 

get { return _img . imageUr 1 ; } 
set { _img.lmageUrl = value; } 

} 

public int Align 
{ 

get { return _algn; > 
set { __algn = value; } 

protected override void CreateChildControls ( ) 
{ 

AdminModeDr ew ( ) ; 
if ( _algn == 0) 

_img . ImageAlign = ImageAlign. Left ; 

else 

_img . ImageAlign = ImageAlign. Right; 
Controls. Add (_img) ; 

} 

public class recipient : ctrlmode 
{ 

public ArrayList _ctrls; 

public recipient () { _ctrls = new ArrayList 0; } 

public void Add (Control obj) 

{ 

_c trls . Add ( obj ) ; 

} 

> 

public class ctrl4 : ■ recipient 
{ 
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int _pos; 

public ctrl4 ( ) :base ( ) { } 
public new void Add (Control obj) 

base. Add (obj) ; 

public int Pos 

get { return _pos;} 
set { __pos = value; } 

public String Self 

get { return _abspath; } 
set { _abspath = value; } 

protected override void CreateChildControls ( } 

AdminSIodeDraw ( ) ; 

Control obj; 
if (_ctrls .Count ==0 ) 
return; 

Table tbl; 
TableRow tr; 
TableCell td; 

tbl = new Table ( ) ; 

tr = new TableRow ( ) ; 

td = new TableCell {); 

obj = (Control) __ctrls[03; 

td . Controls . Add ( obj ) ; 

tr. Cells. Add(td) ; 

tbl. Rows .Add(tr) ; 

tr = new TableRowO; 

td = new TableCell ( ) ; 

obj = (Control) _ctrls[l]; 

((ctrll) obj) .Align = _pos%2; 

td . Controls . Add { obj ) ; 

obj = (Control) _ctrls[2]; 

td . Controls . Add ( obj ) ; 

tr. Cells. Add (td) ; 

tbl. Rows. Add(tr) ; 

Controls. Add (tbl) ; 

} 

} 
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Cliapltre 2 - Architecture de vues editables 

Les principes de base decrits au chapitre precedent restent valables, cependant on va maintenant 
dSrire et fllustrer une methode selon laquelle tons les elements XML peuvent etre des fregjnente 
selon I'usage qu on en fait. En effet, contrairement au chapitre precedent ou les fragment eta ent 
specifies de maniere permanente dans les donn6es, ce sont maintenant les programmes (dans leur 
mode administration) qui decident quels elements sont utilis6s en tant que tragments. 
Ainsi chaque fragment n'existe que pendant la duree d'execution de la page (en mode 
administration) qui l'utilise. 

Chaque page (programme aspx ou analogue) est assimilee a une « vue » (au sens des bases de 
donneesj sur les eleu.euU, XM fc-^He-utHfcc. En mode administration 7 ce s ont ce s wa qui 
distinguent les noeuds fragments des autres nceuds XML et permettent de les mampuler 
noSnent de les 6diter ouSicore de les importer d'un endroit a 1'autre dans un merne document 
XML ou entre plusieurs documents dans un meme ordinateur ou meme entre des serveurs 
differents (par exemple via un service web charge de g6rer chaque document). Ana ce sont des 
vues gditables. 



« Modl@="&dmm" » 



Prenons un exemple de donn6es XML tres proche de celui presents au chapitre precedent 

Bocumentl' 

<?xml version='1.0' ?> 

<PAGE> 
<BLOO 

<HEADBLOC>Ceci est un premier sous-titre</HEADBLOC> 
<SMALLBLOC src="imagel jpg" video="videol .mpeg'7> 
<BiGBLOC>texte texte texte texte texte texte </bigbloo 
</bloo 

<BLOC> 

<HEADBLOoCeci est un autre sous-titre</HEADBLOO 

<SMALLBLOC src="image2.jpg'7> 

<BiGBLOOautre texte autre texte autre texte </BiGBLOC> 

</BLOO 
</PAGE> 

Chaque composant FgmtCtrl a comme attribut la liste des modes administration pour lesquels 
lament auquel il s'applique (d&igne" par 1' attribut Element) est spScifie comme etant un 
fragment. Dans le programme aspx ci-dessous, seul les elements BLOC et HEADBLOC est defmi 
comme 6tant fragment manipulable (dans un mode administration M ode="admin» ; noter que dans 
le cas general, plusieurs valeurs peuvent etre donnees pour cet attribut). 

2%{ RSrTagPrefix="App" NameSpace="W e bControlLib ra ryi23" Assembly^tagcontrols" %> 

<%@ Page Language="C#" Inherits="Lib.PageCtrl" %> 

<html> 

<body> 

<fbrm runat="server"> 



7 (on peut distinguer plusieurs modes administration et les nommer differemment) 
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<App:PageCtrl Data=="..\documenti.xml"> 

<App;FgmtCtrl Eiement="PAGE" Control^'ctrlS" NameSpace="Lib" Asm= u PWebControls'' Args== "Empty" 
runat-"server tt > 

<App:FgmtCtr! Element="BLOC tt Mode="admin" Control ^ctrl'*" NameSpace=:"Lib" Asm^PWebControls" 
Args="Empty" runat="server"> 

<App:PropertyMapping Name="Allgn" Va lue= "Const: 1" Asm= w PWebControls" runat="server7> 

<App:FgmtCtrI E!ement= "headbloc" Mode= M admin" Control= n ctrl3" NameSpace="Lib" Asm=*PWebControte" 
Args= "Content" ru nat="server"/ > 

<App:FgmtCtrl Eiement="SMAiLBLOC" Control ="cirlii" Target="aspx3.aspx?SMAi_LBLoc rf NameSpace="Lib" 
Asm=*PWebControls" Args="Content" runat="server"> 

<App:PropertyMapping Name="Image" Value="@src" Asm^PWebControIs" runat= "server"/ > 
</App:FgmtCtr!> 

<App:FgmtCtrl Element= w BiGBLOc" Control="ctrl2X" Target="aspx2.aspx?BLOc" NameSpace="Ub" 
Asm=*PWebControls'' Args= "Content" runat= "server" /> 

</App:FgmtCtrl> 

</App:FgmtCtrl> 

</App:PageCtrl> 
</form> 
</body> 
</html> 

Le programme aspxl.aspx ci-dessus pr6sente la page esquiss6e a la figure 4.a et pr6sente la m£me 
page en mode administration comrae illustr6 sch6matiquement & la figure 4.b. 

Les composants ctrll et ctrl2 ont un comportement particulier : 

- ctrl2 prgsente £ Futilisateur un extrait du contenu textuel de T616ment BIGBLOC ainsi. 
qu'un lien hypertexte dont V activation d&lenche l'appel de la page aspx2 (voir ci-aprfes) 
qui pr&ente BIGBLOC dans son integrality mais ignore r element smallbloc ; 

- ctrll se pr€sente sous la forme d'une image (celle d6finie dans T616ment SMALLBLOC : 
respectivement imagel.jpg ou image2.jpg) munie d'un lien hypertexte dont Tactivation 
appelle la page aspx3 (voir ci-apr6s) dont le role est de presenter le film sp6cifi6 (le cas 
Sch&mt) par rattribut « video » de SMALLBLOC (« videoLmpeg » dans le premier bloc ; 
pas d'attribut vidgo dans le second bloc). 

Le composant ctr21 a Failure suivante : 

public class ctrl21 : ctrlmode 
{ 

String .jaesg^link^absolutepatli; 
int _pos; 

public ctrl2() { _jnesg * "body"; } 
public ctrl2 (String msg) { _mesg = msg; } 
public int Pos 
{ 

get { return _pos;} 
set { _pos = value; } 

} 

public String Target 
{ 
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get { return _link;} 
set { _link = value; > 

) 

public String Self 
{ 

get { return _absolutepath; } 
set { _absolutepath a value; } 

} 

String getExtract ( ) 
{ 

} 

protected override void CreateChildControls { ) 
{ 

j feetea aModeDra&j f ) ; 

Literal 1 = new Literal ( ) ; — 

l.Text = "<div> <paragraph>" + getExtractO + 
n </paragraph> </div>" + 

u <a href =\ "+ _link + " = » + _absolutepath+ 
n \ n > ♦ . ♦ </a> n ; 
Controls .Add (1) ; 

} 

> 

aspx2.asps 

<%@ Register TagPrefix== rt App" NameSpace= n WebContro!Ubraryl23 n Assembly^ "tag controls" %> 

<%@ Page Language= n C#" Inherits-"Ub.PageCtri" %> 

<html> 

<script language="C#" runat="server"> 
void Page_Load() 

Fgmtetrl2*£l<smerat = Request-Parareisf'SLOC"]; 

} 

</script> 
<body> 

<fbrm runat~"server"> 

<App: PageCtri Data="..\documentl.xm("> 

<App:FgmtCtrl Element^ "PAGE" Control="ctr(6" NameSpace= n Lib" Asm ="PWebControls" Args=" Empty" 
runat="server"> 

<App:FgmtCtrl ZD= , Tgm4Clrl2 r * ControI="ctrl4 n ^ode="admin n NameSpace^Lib" Asm=*PWebControls" 
Args= n Empty" runat="server"> 

<App:PropertyMapping Name= tt AKgn" Value= "Const: 1" Asm=*PWebControls" runat="server n /> 

<App:FgmtCtrl Element= n HEADBLOc tt Control="ctrl3" NameSpace="Lib u Asm= M PWebContro!s" Args= M Content" 
runab="server7> 

<App:FgmtCtrl Elements "bigbloc" Controi= n ctrl21" NameSpace=="Lib" Asm= tt PWebControls" Args^" Content" 
runat="server" /> 

</App:FgmtCtrl> 

</App:FgmtCtrl> 

</App;PageCtr!> 
</form> 
</body> 
</html> 



32 



m 



Lament bloc est Editable, cependant les modifications effectives seront directement visibles 
dans la page aspxl.aspx. Nous verrons plus loin comment importer un fragment et le modifier 
inddpendamment de la source. 

En variante, ce programme peut aussi 6tre le suivant (dans ce cas dans aspxl.aspx la valeur de 
Tattribut Target doit etre "aspx2.aspx?BiGBLOC"): 

aspx2'.aspx 

<%@ Register TagPrefix= fl App n NameSpace^ n WebControlLibraryl23 tt Assembly="tagcontro!s w %> 
<%@ Page Language= tt C# n Inherits=''Ub.PageCtrr' %> Y u,9Contro ' s /0> 

<html> 

<script language="C#" runat="server ff > 
void Page__Load() 

FgmfcCtrl2.Element a Kequesfe-ParamsE^BKSBLOc"]; 

</script> 
<body> 

<form runat= tt server°> 

<App:PageCtrl Data= ,, .Adocumentl.xml ,, > 

<AP Arg^ Mode="admin" NameSpace="Lib n Asm= tt PWebControls /? 

</App:PageCtrl> 
</form> 
</body> 
</html> 

Dans ce dernier cas on peut 6diter bigbloc dans la page affich6e en mode administration car le 

COmpOSant "FgmtCtrl2" est en Mode= "admin". 

Le composant ctrlll, qui renseigne Tattribut Target du composant en question dans le 
programme appelant (aspx 1 .aspx), a I s allure suivante : 

public class ctrlll z ctrlmode 

{ 

Image _img; 
int _algn,_pos; 
String _link; 

public int Pos 

get { return _pos;} 
set { _pos as value; } 

public String Target 

get { return _link;} 
set { _link « value; } 

public String Self 

get { return _abspath; } 
set { __abspath = value; } 

public String Image 

get { return _img . ImageUr 1 ; } 
set { _img. ImageUr 1 = value; } 
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} 

public int Align 

get { return _algn; } 
set { _algn = value; } 

protected override void CreateChildControls ( ) 

AdminModeDrawO ; 
Literal l=new Literal O ; 

l Text « «<a hre£=\»" + -link + « = »_abspath + 
l.Text <a nrw^ src=x „ + _ imgUrl+ «\> </a>»; 

Controls. Add (1) ; 

} 



Enfin voici Y allure de la page aspx qui presents la video dans les cas ou die est specifiee dans le 
fragment SMALLBLOC en question: 

^AiSrTagPre^ "App" NarneS^ Assembly-tag control o /o > 

<o/ 0 @ Page Language«"C#" Inherits—Li b.PageCtrl'' %> 

<html> 

<script language="C#" runat- "server 7 > 
void Page_Load() 

i FgmtCtrU-Eienient = Request.Params["SMALLBLOc' f ]; 

} 

</script> 
<body> 

<form runat="server w > 

<App:PageCtrl Data= tt .Adocumentl.xmr> 

<A DD -FamtCtrl ID-'FgmtCtrli" Element— smaubloc w Control "ctrlNpeg" Mode-admin" 
P NamS?ce=» Args^ "Content" runat-server«> 

</App:PageCtrl> 

</form> 

</body> 

</html> . lt . ^ 

comnosant ctrlMpeg presente le film si P attribut video est renseign6, sinon U presente 1 image 
de r element courant qui lui est passe dans le constructed. Dans les deux 
cas, des boutons d' administration seront ajoutes en Mode="admm . 
public class ctrlMpeg t ctrlmode 
{ 

XmlNode elmt; 
int _pos; 

Public ctrlMpeg (XmlNode elem) 
{ 

elmt = elem; 

> 

public int Pos 
( 

get { return _pos;} 
set { _pos - value; ) 

> 

public String Self 
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{ 

get { return _abspath;> 
set { _abspath - value; } 

} 

protected override void CreateChildControls ( ) 
{ 

AdminModeDr aw ( ) ; 

If (video attribute exists for elmt) 

Controls .Add ( 0 . . .video player . . . ■ ) ; 

else if (src attribute exists for elmt) { 
Literal 1 =new Literal { ) ; 

l.Text = "<img src=\°" + elmt.Attribute("src" ) 

+« \V>" 
Controls. Add (1) ; 

} 

else 

Controls .Add {"..."); 

} 

} 

Fragments impories 

On va maintenant dScrire un exemple ou on va importer des fragments (et done m&noriser leurs 
r6fSrences vers leurs sources). 

Reprenons T exemple de donn6es XML. 

Document! 

<?xml version^l.O' ?> 

<PAGE> 
<BLOC> 

<HEADBLOOCeci estun premier sous-titre</HEADBLOC> 
<SMALLBLOC src="imagel jpg" video= ,r videol.mpeg , 7> 
<BiGBLOC>texte texte texte texte texte texte </bigbloc> 

</BLOO 
<BLOO 

<HEADBLOC>Ceci est un autre sous-titre</HEADBLOO 
<SMALLBLOC src="image2 jpg'7> 

<BlGBLOC>autre texte autre texte autre texte </bigbloo 
</BLOO 
</PAGE> 

On ya maintenant importer un fragment BLOC de la m6me mantere que dans le chapitre 
precedent. Ceci peut se faire en pr^sentant les deux documents dans des pages en mode 
administration. 

Document2 (webservicel23) : 
<?xml version^l.O' ?> 
<PAGE> 
<SOMETHING> 
<BLOC> 

<headbloc >Sous-titre du bloc exteme</HEADBLOC> 
<SMALLBLOC src= n image3.jpg"/> 
</BLOC> 
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</SOMBTHING> 
</PAGE> 

Document! (apres P importation) 

<?xml version='1.0' ?> 
<PAGE> 
<BLOC> 

<HEADBLOC>Ceci estun premier sous-titre</HEADBLOC> 
<smallbloc src="imagel jpg" video="videol.mpeg /> 
<BiGBLOC>texte texte texte texte texte texte </bigbloc> 



</BLOC> 
<BLOO 

<HEADBLOC>Ceci est un autre sous -titre</HE adbloo 

<smallbloc src="image2.jpg"/> 

<BlGBLOC>autre texte autre texte autre texte </BlGBLOC> 

</bloc> 
</page> 

Noter que 1' attribut state est a « state="created" » par defaut. 

Le document 1 etant maintenant modifi6, les trois programmes aspx incluront automatiquement 
le nouveau bloc importe dans leur propre presentation. 
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Chapitre 3 - Indexation et selection de fragments 

L'objet de ce chapitre est de d€crire le proc6d6 d J indexation et selection de fragments (ou autres 
entit6s d* informations) selon le premier objet de 1* invention. 

Bien quele proc6d€ permette, de manfere g6n&ale, de s61ectionner une entity d' informations 
parmi un ensemble d'entitg d* informations suppl&nentaires, on va maintenant dScrire son 
application sur F architecture pr6sent£e au chapitre pr6c6dent pour s&ectionner un fragment parmi 
un ensemble de fragments supptementaires. L'homme du m6tier saura adapter le proc6de k 
d'autres applications. 

Description du precede 

Parmi un ensemble de « fragments suppl&nentaires » donn6s, on cherche k selectionner ceux qui 
sont les plus pertinents par rapport k un « fragment de depart ». 

Concrttement, un fragment destine k 6tre pr6sent6 k l'utilisateur peut 6tre sp6cifi6 en dSsignant 
un fragment de depart ainsi qu'un ensemble de fragments supplementaires, de manifcre k ce que le 
programme de presentation selectionne automatiquement, pour ce fragment k presenter k 
l'utilisateur, le fragment suppl&nentaire le plus pertinent. 

Pour ce faire ce programme applique 3 Stapes (qui sont d6crites ci-aprfes) : 

L Selection de pages Web les plus similaires au fragment de depart 

2. Selection des pages Web les plus pertinentes par rapport aux pages resultant de l'6tape 1 

3. S61ection des fragments supplementaires les plus similaires aux pages resultant de F&ape 2. 

Efape 1 : Selection de pages Web ies plus similaires au fragment de depart 

On connaft d6]k de nombreuses m^thodes dans Y6tat de la technique pour rechercher sur la Toile 
des pages similaires ou proches k un document donn6. On peut notamment extraire des mqts-cte 
du fragment de depart puis soumettre ces mots-cle k un moteur de recherche qui retournera les 
pages recherchfies. Diverses techniques d* extraction automatique de mots-cte d*un texte existent 
d6ja dans Petat de la technique 8 . Les moteurs de recherche sur le Web sont egalement courants. 
On ne dScrira done pas cette 6tape d'avantage. 

On pr6sentera plus loin (voir la section « Proc6d6 permettant (notamment) de rechercher des 
pages pertinentes ») un nouveau proced6 automatique ou semi-automatique de recherche de 
pages pertinentes sur le Web, qui peut remplacer la pr6sente 6tape et m6me d'ailleurs aussi 
Fetape suivante 6ventuellement 

Les adresses des pages Web les plus similaires ainsi trouv6es permettront une premiere 
indexation du fragment de depart. En effet, dans la mesure oft un fragment de depart fera partie 
de T ensemble des fragments supplementaires, il est avantageux de memoriser les adresses (url) 
de ses pages similaires ou proches qui r6sultent de r application de T6tape 1. 



8 Voir par exemple les travaux de Luhn et Edmunson, « KEA : Practical automatic kcyphrase extraction. In ACM 
DL, pages 254-255, 1 999 » ou encore la mgthode GenEx de Peter D. Turney . 
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Etape 2 : Selection des pages Web les plus pertinentes par rapport aux 
pages Web les plus si mi I aires au fragment de depart 

Ccci fait robjet du chapitrc suivant (« Calcul des scores de pertinence »). En effet, on y prtsente 
un precede permettant de rechercher sur le Web les pages les plus pertinentes par rapport a un 
ensemble d'url (UR1) de pages Web donnees (en 1' occurrence, par rapport aux pages resultant de 
l'6tape 1). 

Etape 3 : Selection des fragments supplementaires les plus similaires ausc 
pages Web les plys pertinentes par rapport aux pages Web les plus 
similaires au fragment de depart 
HBn r &ultat dc 1' etape 2, on a maintenant un ens emb le (de taille limitee) des pages Web les plus — 
pertinentes (par rapport au fragment de depart). 

II s'agit maintenant de selectionner, parmi les fragments supplementaires, ceux qui sont les plus 
similaires ou proches de ces pages Web les plus pertinentes. Or on connalt dans 1 etat de la 
technique de nombreuses methodes 9 pour selectionner des textes similaires ou proches a des 
textes donnes. La section suivante en presente une nouvelle (qui represente ainsi un troisieme 
objet de r invention). 

Dans le cas ou on indexe les fragments supplementaires, c 4 est-a-dire on leur associe de maniere 
permanente les adresses des pages Web qui leurs sont similaires ou proches , la selection peut 
gtre immediate. En effet, on peut directement selectionner les fragments supplementaires dont les 
adresses des pages Web similaires ou proches ontune grande intersection avec les adresses des 
pages Web les plus pertinentes resultant de 1' etape 2. 



9 Cclles-ci incluent notamment les techniques TF/IDF (Term Frequency / Inverse Document Frequency) et LSI 
(Latent Semantic Indexing). . , , . . . ., 

10 Ceci revient a appliquer l'etape 1 sur les fragments supplementaires (voir plus haul la desenpuon de l etape i;. 
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Procede permettant (notamment) de rechercher des fragments 
pertinents 

L'itie® : exploiter Des liens implicates qui existent entre les phrases 

Appelons « document textuel » le fragment de depart 11 . Tout d'abord on epure le document 
textuel en lui dtant tous les mots « trop courants » (que Ton appelle « stop words » dans le 
jargon) tels que les articles et les pronoms. H ne reste ainsi que les mots signifiants. 

On decompose le document textuel ainsi epure (et etendu le cas echeant, comme mentionne en 
note de bas de page) en unites de textes, telles que des phrases. 

On va maintenant exploiter les liens implicites existant entre unites de texte, un tel lien existant 
entre deux unites quand elles ont un mot en commun. 

Si (de preference) on a & disposition au moins une unite de texte d6jk s61ectionn6e comme etant 
d6jk pertinente, on procMe comme suit : 

Pour tous les mots figurant dans Funite (ou les unites) pertinente(s), on recherche les unites qui 
sont co-citees et on leur attribue un score de pertinence comme d6crit k la section suivante 
(« Determination des scores de pertinence des unites co-citees »). On peut ensuite attribuer un 
score aux mots ou groupes de mots contenus dans les unites co-cites en additionnant les scores de : 
pertinences des unites dans lesquelles ils se trouvent (on peut les ramener k une 6chelle commune^ 
en les normalisant) 12 . 

Si au contraire on n'a pas a disposition au moins une unite de texte d6jk s61ectionn€e comme 
etant pertinente, on procede comme decrit k la section « Determination des scores de pertinence 
des unites de texte ». Egalement, on peut ensuite attribuer un score aux mots ou groupes de mots 
contenus dans les unites de texte en additionnant les scores de pertinence des unites de texte dans 
lesquelles ils se trouvent (et en normalisant). 

Extraire les mots-cle ou select ionner directement les documents 
supplementaires 

On peut alors soit directement utiliser les mots ou groupes de mots ayant les scores les plus 
eieves comme mots-cie constituant une requSte k un moteur de recherche, soit etendre le procede 
pour seiectionner les fragments supplementaires les plus pertinents. Dans ce dernier cas on 
procfede comme suit : 

Ayant attribue un score de pertinence aux unites de texte (selon Tune des methodes evoquees ci- 
dessus), on seiectionne celles qui ont les scores les plus eieves comme etant « deja pertinent ». 
On applique alors le meme procede (decrit k la section « Determination des scores de pertinence 
des unites co-citees ») pour attribuer des scores k des unites de texte de documents (fragments) 
supplementaires (le procede est applique sur P ensemble des documents plutdt que sur un seul 
document). Ensuite on attribue un score de pertinence de document aux documents 



1 On peut optionnellement etendre le fragment de depart en lui concat6riant des fragments ou documents qu'elle cite, 

notamment par des liens hypertextes. L'extension peut se faire h partir des liens hypertextes contenu dans le 

fragment de depart seulement ou, en plus, en suivant les liens hypertextes contenus dans les documents eux-mdmes 

cite, et ainsi de suite pour un nombre de niveaux donne ou selon d'auties conditions. 

12 Les mots ou groupes de mots peuvent eventuellement Stie compl6t£s par les adjectif s qui s'y appliquent 

majoritairement 
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supplementaires f pris individuellement) en prenant la moyetme des scores de pertinence des 
unites qu'ils contiennent. On s£1eetionne les documents supplementaires ayant les meilleurs 
scores de pertinence de documents. 

Une autre application possible du procSde est aussi a noter: les unites de texte ayant les meilleurs 
scores peuvent 6tre assembles pour former un resume. 

Determination des scores de pertinence des unites co-eile©s 

On identifie les unites de texte comprenant au moins un mot en commun avec Tunite (ou 
Fensemble des unites) pertinente(s), pour former un groupe d'unites de texte citantes. On cr6e 
(temporairement) un lien & partir de chaque unite de texte citante vers F unite (ou F ensemble des 

nnifrV) dp tp.xtp. pp.rrinftntf >(^). 

On identifie les unites de texte contenant au moins un mot egaJement contenu dans les unites de 
texte citantes, pour former un groupe d'unites de texte co-citees. On cree (temporairement) un 
lien a partir de chaque unite citante vers chaque unite co-citee avec laquelle ladite unite citante 
possede au moins un mot en commun. 

On applique ensuite les precedes de calcul de scores de pertinence d6crits au chapitre suivant. 
L' ensemble des identifiants des unites de texte pertrnentes constitue les UR1 de la requete. 
V ensemble des identifiants des unites de texte citantes constitue F ensemble R. V ensemble des 
identifiants des unites de texte co-citees constitue F ensemble des « pages candidates » 13 , c'est-&- 
dire 1' ensemble R~+. Et ainsi de suite.. . Le proced£ symetrique (voir la section « Cadre g6n€ral 
pour le traitement par Faval ») est ici Equivalent 

Determination des scores de pertinence des unites de texte 

Les unites de textes sont ordomtees selon leur emplacement dans le texte. A chaque unite de texte 
est attribue un nombre de liens entrants (k partir des unites pr€c€dentes) et un nombre de liens 
sortants (vers les unites suivantes). 

Le nombre de liens entrants est le total des unites pr6c€dentes dans le texte qui ont un mot en 
commun. Soit £= nombre de liens entrants +1. 

Le nombre de liens sortants est le total des unites suivantes dans le texte qui ont un mot en 
commun. Soit S~ nombre de liens sortants +L 

On va appliquer un coefficient pour contrebalancer Feffet de la position de Funite dans le texte 
sur son nombre de liens entrants et sortants. Pour un texte de n unites, pour Funite de texte ayant 
la position m, le nombre de liens entrants sera pond&6 par 1 - (m+l)/(n+l), et le nombre de liens 
sortants sera pond6te par (m-fl)/(/z+l). 

Le score appliqu6 & chaque unite sera tout simplement la somme des liens entrants et sortants 
pondetes : score « £*(1 - (m+l)/(n+l)) + S*(m+l)/(/*+l). 



13 Les « pages » du chapitre suivant sont ici des unites de texte. 
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Chapitre 4 - Calcui des scores de pertinence 
Introduction 

Les approches existantes de l'etat courant de la technique permettent de trier ou selectionner des 
pages selon un critere de qualit6 « dans l'absolu ». En effet, selon ces approches, une meilleure 
page est sort une page plus populaire sort une page qui cite plus de pages plus populaires. Le 
present proc6de permet, au contraire, de trier ou selectionner des pages selon un critere de 
pertinence par rapport a un ensemble d'URI 14 donnes comme etent eux-m6mes pertinents. 
Pour faciliter la lecture, on va considerer les 7 ensembles suivants (voir la figure 5): 

«> R est constituS par les pages de la requ6te (c'est-a-dire leurs URI) et on suppose ici que 
ces dernieres sont homogenes au sens du proc6d6 de base 15 . 

• R' est l'ensemble des pages qui contiennent un lien vers 16 au moins une des pages de la 
requgte. 

• R' + est V ensemble des pages pointees (citees) par les pages FT. 

• R +' est 1* ensemble des pages qui citent les pages RT+ ( R~ c R-+- ). 

• R* est 1' ensemble des pages cities par au moins une des pages de la requgte (R). < 
« R+' est 1' ensemble des pages qui citent les pages R+. :?* 
® R + ' + est l'ensemble des pages cities par les pages de R*' (R* a R*~+). 

Homogeneity d'un ensemble de pages 

?S™t S f nte ' Ta ' Un proc6d6 de calcul de score de pertinence d'un URI par rapport a un ensemble ; 
d URI donn6 en entree (pour constituer ladite requgte de recherche). Ce process est base - sur une 
analyse des liens hypertextes et ne necessite pas d'analyser le contenu des pages pointees, ni le 
texte autour des liens hypertextes. 

L'idee essentielle du calcul du score de pertinence (d'une page P 2 par rapport a une page donnee 
Pi) est la suivante 17 : 

Soitp } la probability 18 qu'un auteur ateatoire (de page Web) mette dans une page un Hen sur Pj. 

Soitp 2 la probability qu'un auteur aleatoire mette dans une page un lien sur P 2 . 

Sort p 1&2 la probability qu'un auteur aleatoire, mette dans une page un lien sur Pj et un lien sur 

°2- 

B(Pj) est 1* ensemble des URIs des pages ayant un lien vers la page Pi. 



I^f* 8 . appeKs € **** » 00 « r «J uete *> recherche ». Typiquement, les URb figurant dans les bookmarks, ou 
liens favons, peuvent constituer une telle requgte.) 

16 ? n verra plus loin comm ent decomposer une requSte en sous-requetes homogenes 
j7 (autrement dit « qui citent », ou encore « qui pointent ») 

J'^S 1 " ous f ons c °°siderer que P, et P 2 , (ou P„ P } , etc) sont des pages Web, bien que les process decrits 
soientbien plus generaux, comme on l'adeja mentions brievement 

on^^™?iw w 0 *^ 886 Paf UDe ( °. U ccrtaines ) P a 6 e < s > est approches en comptant le nombre de pages qui 
ont un hen sur elle(s) et en divisant ce nombre par une estimation du nombre de pages qui auraient pu en avoir 
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F(P 5 ) est r ensemble des URIs des pages vers lesquelles P* a un lien. 

La pertinence d'une page par rapport a un ensemble de pages peut Stre definie par la « quantite de 
raisons communes » d'etre intgresse par toutes ces pages. 

Des calculs algebriques permettent d'obtenir des equations donnant la quantit6 de raisons 
communes entre plusieurs pages. Cette quantit6 (ou proximite, ou encore homog&ieite) est notee 
x 9 avec en indice les pages dont il est question ; la probability d'Stre 116 a une certaine page Pi est 
notge pi ; la probability d'&tre li6 & au moms une page parmi P^ Pj, . . . , P n est not€e : 

jc~ == ElJU , ^= PrP * Pk Pijk , et ainsi de suite (tous les sous-ensembles de taille impaire 

P 0 * Pij P0 * Pij * Pik • Pjk 
au numera lcur, el les autre s- au dgnominat e ur) 1 : ? _ . 

Cette Equation peut Stre not£e de fagon plus compacte ainsi : x s = p P P avec <r p 

PcS 

L'spproche de Valgorithme 

Les probability dont il est question ci-dessus font intervenir le nombre (le comptage) des pages 
de R~ qui contiennent un lien donne ou un lien parmi un ensemble d'URI donn6s (vers des pages 
de 2? + ). On gagnerait & ponderer ce nombre par la qualite de citation (score hub, dScrit plus loin) 
de chaque page qui contient un tel lien. 

On voudrait ainsi qu'une page de R citant plus de meilleures pages (de R * + ) soit consid6r£e 
comme 6tant de meilleure quality de citation, et qu'en retour un poids plus fort lui soit donne 
dans le cadre du calcul des scores 20 des pages qu'elle cite (R "*), les scores des pages de FT et ceux 
des pages de R + s'influengant mutuellement dans une approche iterative (de renforcement 
bipartite) qui converge 21 . 

Le nombre de pages de R~*~ citant chaque page candidate (de R*) intervient aussi dans les calculs. 
Or leur prise en compte coflte cher. On va alors approximer les resultats en ne consid6rant que 
celles qui citent les pages candidates ay ant un bon score, ce score 6tant calcule d'abord en ne 
considfrant que R~ et ensuite en 6tendant cet ensemble vers progressivement. 

Trouver les pages recentes 

Pour calculer le score de pertinence d*une page candidate, au lieu de prendre le r6sultat de 
T equation de quantit6 de raisons directement, il est preferable 

o de la prendre avec les cardinality d' ensemble remplacSes par le total des scores hub des 
pages en question et 



19 Les banes sup&ieures indiquent des complements, et p 0 , la probabilit6 d'aimer au moins une page d'un ensemble 
vide, est une constante ggale & z£ro ; elle est prdsente dans 1* Equation pour des raisons de coherence. 

20 Rappelons qu'il s'agit ici de scores de pertinence par rapport & la requite, contrairement de T6tat de la technique 
qui permet de determiner un score de quality « dans I'absolu ». 

™ Noter que le calcul du score de pertinence d'une page de R-+ peut rdsulter en une valeur negative (que Ton va 
alors neutraJiser ; ceci est d6crit plus loin). En effet, certaines pages peuvent £tre, non seulement pas proches de la 
requite, mais mSme antagonistes par rapport a elle Oe fait d'y etre int6ress6 diminue les chances d'aimer les pages de 
la requite et invers^ment). 
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* de multiplier ce r&ultat par le score autorit6 de la page candidate (simplement calcule k 
partir du total des scores hub des pages citantes), afin d'affaiblir ainsi les pages qui sont 
relativement moins fiables (car moins populaires). 

Les scores hub des pages citantes ainsi trouv^s vont ensuite servir & determiner les pages 
qui sont pertinentes sans Stre populaires, au moyen d'une Equation de proximite, telle que 



vont etre remplac£es par le total des scores hub des pages en question 22 . 

En r6sum6 : d'abord on determine les pages pertinentes (et populaires k la fois) par la premiere 
m6thode qui en plus donne les scores hub des pages citantes (et de man&re fiable). Ces scores 
perrnettent ensuite de trouver les pages pertinentes mais pas (encore) populaires. 

Regions de pertineme dans les pages 

Aprfes une premiere iteration, dans les pages citantes le systfeme peut v 

© repgrer les regions contenant des liens dirig6s sur des pages de K* ayant un bon score 

@ et commencer dej& k elaguer les liens qui ne sont pas situ6s dans ces r6gions. 

Comme les liens en question se trouvent plac6s sous des noeuds d'une structure typiquement 
arborescente de document (tel qu'en HTML notamment), pour determiner une region d4 
pertinence il suffit de prendre les nceuds (minimaux) qui englobent tous les bons liens et de leur 
retrancher les sous-noeuds (maximaux) qui contiennent un mauvais lien et qui ne contiennent pas 
de bon lien. Par « bon » lien on entend : un lien dirigS sur une page ayant un bon score. Par 
« mauvais » lien, on entend : un lien qui a 6t6 explicitement refuse par Futilisateur. 



Calcui de pertinence par Vamont 

L' algorithme permet, ayant un ensemble homog&ne (ayant une homog6n£ite suffisante) d'URIs 
associe a des pages proches (un « noyau »), d'obtenir une liste d'URIs de pages qui sont 
int6ressantes relativement & cet ensemble. II sera d6crit plus loin comment exploiter cet 
algorithme pour obtenir un ensemble de pages int&essantes pour un ensemble inhomogfene que le 
concepteur d'un recipient aura mis ensemble. 

En entr6e, cet algorithme prend 

o un ensemble K d'URIs de reference (« Kernel ») 
o un ensemble A d'URIs candidats (« Authority ») 
® un ensemble H d'URIs candidats pivots (« Hub ») 
• un ensemble T d'URIs & refuser (« Trash ») 



22 On peut dire que Ton remplace les cardinality par des « cardinality pond6r£s »» les poids £tant les scores hub. 



x s = 



dans laquelle les cardinality d' ensemble (representees entre barres verticales) 
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On a : K ' c H c: A'et T n K =0. (E etant un ensemble d'URIs, E" = |JB<7^.) et E + 

P,eF. 

J 

1 . Associer a chaque page Pi de H, un nombre h i9 mis imtialement h t-~ r , son score hub . 

PI 

2. (Re-)calculer les scores autorite : 

a. Pour chaque page P( de -A, en commensant par celles de K 9 associer un nombre au 

S[0 s'il n'y a pas de lien entre Pj et P § 
; . J/ J Ji ll s lly a un lien entre PjetP. 

h Une opttmisati™) possible i ^s r-An*^^ pnnr certaines p ages, at est 

suffisamment proche de sa valeur calcutee pr^cedemment (le cas 6ch€ant), et que 
les scores autorit6 des pages de K n'ont pas variS non plus, nous pouvons garder 
T ancienne valeur de r,- pom cette page, pour 6conomiser les calculs. 

3. (Re-)calculer les scores de pertinence : 

a. Pour chaque page P f de A calculer r* t 6gal k w iyjK 



et dans le cas oil le r&ultat est n£gatif (cas d'une page antagoniste k R) neutraliser 
les liens entrant de mani&re k avoir r. + = 0 . 

L'homog&i6it6 par 1* amont ws d'un ensemble S est dgfinie cornme suit: 

1-lsiP contient un nombre pair de pages 
+ lsinon 

a P ^A^hjljp oil 
j 

A est une constante arbitraire inf&rieure mais proche de 1 (elle 
sert a 6viter des divisions par zero mais ne change pas le principe 
de ralgorithme. Si Tensemble H est plus grand que K" alors cette 
constante peut Stre egale & un 

+lsi3P i eP|/ ; ,=+l 

Osinon 

0 s'il n*y a pas de lien entre Pj et Pj 

1 s'il y a un lien entre P i et P } 

En d'autres termes, l JP est 6gal & 1 s'il y a un lien 

© d'unepagePj (dsN) 
© h au moins une page Pf de P 
et z£ro sinon. 



PczS 

a 



avec Iji = - 
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Ainsi, avantageusement, la sonune des |H| scores h t ost 6gale & 1. 
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Ceci signifie tout simplement que a p est le total des scores hub 
des pages (de H) qui pointent sur au moins une page de P (P 
etant le sous-ensemble courant de S qui est consid6r<§). 

Pour chaque lien fa existant on peut lui associer un poids en 
fonction de la proximite des pages Pi et Pj et ameliorer ainsi le 
resuhat - voir plus loin « Filtrer le Nepotisme ». 

Ici, puisque VP { e K on a r* = w K (la pertinence est la mgme pour toutes les pages 
Pi de K), le score de pertinence r/** ne doit 6tre calculee qu'une seule fois pour les 
pages de K (elle sera d'ailleurs d6j& calcutee lors de la procedure de d6coupage de 
la requSte R en sous-requ&es (noyaux) K, et sera done d6j& connue h V entree de la 
procedure). 

b. (Ce point sera saut6 la premfere fois.) Pour avoir leur somme 6gal & 1, on doit 
diviser chaque r* + par la somme 2|r/| de toutes les valeurs absolues des r t \ Soit 



+ 

r, ~w\ 



5 la variation globale du score de pertinence. 



Si 8<e (e>0 dtant une marge d'erreur), on considfere avoir converge et le proc6dg' 
s'arrSte. Sinon, le proedde continue. 



+ 

c. On remplace r t par 



r t h-> 



on peut aussi utiliser un facteur de frottement % : 
+ 

r. t ^rri+T g^Tj • ( x e KlL on prendra de preference une valeur tres petite e.g. 

i 

0.01 pour que dans les cas oii ce n'est pas n£cessaire le nombre derations ne 
change pas) 

4. ^Pour chaque page Pt de H : 

a. Trouver tous les liens qui pointent sur une page ayant un score de pertinence plus 
grand qu'un seuil epsilon k choisir ( s>0 ). 

b. Trouver le plus petit Element HTML 25 contenant la totality des liens trouvds au 
point a ci-dessus. 

c. Pour chaque lien pointant sur une page de T (si T n'est pas vide), trouver le plus 
grand element HTML le contenant (s'il y en a) et ne contenant pas de hen trouvS 
au point a. ci-dessus, et renle ver de //. 



* Ce point peut dventuellement 8tre ignore aprfes la premie fois. 
(ou autre representation analogue. . .) 
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d. On garde tous les liens restant dans h et on supprime les autres (ou bien on les 
neutralise en mettant leur ly & z6ro) 

5. Recalculer les scores hub: 

a. Pour chaque page P t de H, calculer/^ =X / uO > la somme des scores de 

J 

pertinence des pages point6es. 

SKI 

(La division par est > comme pour le score de pertinence, pour garder 
leur somme ggale h. 1). ~~ — 

Ensuite retourner au point 2. 
Extension R"*" 

Initialement, pour ne traiter qu'un xiombre r^duit de pages, les scores de pertinence peuvent ettre 
calculus sur la base de R~ (si on avait pris H=K). Ceci ne sera alors qu'une approximation. En 
effet, pour que les scores soient corrects, il faudrait les calculer en se basant plut6t sur H=R~*~. 
Mais comme la constitution de R'*~ est relativement coOteuse, on ne prendra qu'un sous- 
ensemble : on prendra pour R*~ seulement les pages pointant sur les pages de A qui ont un bon 
score. 

Ainsi 26 , on va ajouter une sous-6tape avant la fin de F6tape 2.a : 

2.aJ. Dans le cas oh le score r? de la page courante (P t de A) est suffisant 27 , on 
recalcule r* apr&s avoir ins6re dans H les nouvelles pages de B(Pj) 

H^B{P t X}H. 
D6f avoriser les pages moins fiables 

On introduit un score autoritd pour les pages de A et V equation r* est r = w iKjK ^.(plut6t que 
r = w iyjK ). Le nouveau coefficient a t permettra d'affaiblir les pages peu fiables (par le fait qu'ils 
sont peu populaires). En outre, liquation sera plus coh£rente dans la mesure ou le score 
pertinence ne sera plus le mfime pour toutes les pages de la requgte. 

La procedure est maintenant la suivante : 

1. Ce point est le mSme que celui de Falgorithme de calcul de scores de pertinence pr&ente 
plus haut. 

2. Ce point ne change pas non plus. 

3. (Re-)calculer les scores de pertinence : 

a. Pour chaque page P ( de A calculer r?> egal aw lW * a, et dans le cas oil le r6sultat 
est n6gatif (cas d'une page antagoniste k R) neutraliser les liens entrants de 
manifcre k avoir r* = 0 . 



26 Plusieurs me'thodes peuvent Stre utilisees ; nous piesentons ici la preTeree. 

77 (c'est-a-dire superieur a un seuil choisi ; ce seiril pouira etre fonction de la cardinality courante de H , en effet plus 
on se rapproche de (e.g. H fimh ) plus le score calcule* a des chances d'etre deja correct) 
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b. Poursuivre a partir du point 3.b de I'algorithme de calcul de scores de pertinence 
presents pr6cedemment. 

Filtrer le Nepotisme 

Pour chaque lien Iji existant on peut lui associer un poids en fonction de la proximit6 des pages Pi 
et Pj et ameiiorer ainsi le resultat On appelle cela « filtrer le Nepotisme » car cela permet de 
diminuer I'importance des liens entre pages qui se promeuvent mutuellement. Typiquement on 
amve ainsi a filtrer par exemple les liens des « sommaires » et autres « menus » qui, de maniere 
repetitive, setrouvent dans toutes les pages d'un site. 

Vid€& de base consiste a affaiblir les Uens reliant deux pages que nous savons proches, en 
affectant un poids a chaque Hen, poids qui sera egal au complement de la proximite des deux 
pages reh6es (plus la proximite est grande, plus le lien doit 6tre affaibli). Une fois que les liens 
sont ainsi ponderes, il est possible de calculer l'homogeneite d'un ensemble de pages en utilisant 
non plus le nombre de pages citantes, mais la somme de leurs poids. 

Au point 3.a de I'algorithme, on remplace dans la definition de du score autorite 2 V/p P** 

XWjp ou £ JP =mm[l;max^ f .^)] 
Explications : 

• Iji ■ est le complement de la proximite entre la page Pj et la page Pi s'il y a un lien 

de la page Pj a la page Pi , et zero sinon 

• "JgFfc* ' x ji ) est le complement de la proximite entre la page Pj g H en question et la 
page P ( eP pour laquelle le lien entre P } et P t presente la proximite minimum 

• min [l; m ^(^/ • x jt )] signifie que cette valeur est tronquee superieurement a 1 

w . , [0 s'il n'y a pas de lien entre P. etR 

• et toujours / .. = 4 1 1 

[1 s'il y a un lien entre P, et P { 

En d' autres termes, s'il y a au moins un lien 
® de la page P, (de H) en question 

• a une page P t de P, 

tjp est egal au complement de la proximite entre la page P } et la page P, qui lui est la moins 
proche et vers laquelle elle possede un lien. %£ JP est la somme des poids ainsi associes aux 
pages de #qui pointent sur au moins une des pages du sous-ensemble P consider. 
Pour determiner la proxmiite^, on peut prendre l'equation de quantite de raisons communes 

(dejad6crite): ~- p *' p * 

Pe • Pad 

^S^l^afSS ° n exemple °* le nombre de pages pointant sur Ia page A est 6gaI a 

Le nombre de pages pointant sur la page B est egal a 02+0.7+0.3+0.5=1.8 
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1 er depot 



Le nombre de pages poinlant sur A ou B (N p A z) est 6gal a 0.9+0.2+O9+0-S+0.3+0.5=:3.6 
Aimi, si on considere que \ff\ + ft = 1 00 Je calcul de la proximite de A et B donne : 



*AB 



_ Pa'Pb - 



0.977 -0.932 



1*0.964 



f ce qui donne x AB = ^ « 0.264 = 26.4% 
Pa 



• Pab 

Le filtrage du nepotisme d€crit ci-dessus utilise un facteur de nepotisme .x yr . . Puisque nous avons 
maintenant les scores 28 des pages citantes, nous pouvons eventuellement ameliorer le precede cn 
prenant x H -hj eomme facteur de nepotisme (au lieu de x#)> ou h } est 1e score de la page 
citante. En effet, il faut d'autant plus affaiblir un lien n^potiste (d'une page citante Pj a une page 
citee Pi) que le score de la page citante Pj est faible. 



Decomposer une r&qu§ie en noyaux (sous-requSies homogenes) 

Uutilisatenr fournit au systeme un ensemble J? de pages auxquelles il est int6ress6 et 
dventuellement un ensemble de pages R x de pages qu'il ne veut explicitement pas ( R n R x = 0 ). 
Le systfcme va identifier au sein de R au moins un groupe de pages « homogfene » et va lancer une 
sous-requ6te s6par£e sur ce ou chaque groupe. Ces groupes sont appell6s « kernel » (ou noyau). 
Pour former la rSponse k Tutilisateur on prendra ensuite une combinaison des scores obtenus. 

Procedure : 

1 . Pour chaque page P t de R, trouver B(P0> V ensemble de pages citant P u 

2. Trouver R~ = [J ), Y ensemble de pages citant au moins une page de R. 

3. Dans les pages de R qui ne sont pas encore dans un noyau (au dSbut aucune ne Test), 
trouver la page Pb ay ant le plus grand ensemble B(P B ) de liens entrants 29 , et cr6er un 
noyau contenant seulement cette page. Ce noyau est maintenant Kc, le noyau courant en 
construction (a tout instant il n'y en a qu'un seul). Si toutes les pages se trouvaient dans 
au moins un noyau alors passer au point six* 

4. Trouver les pages pertinentes par rapport h. Kc (en utilisant Talgorithme de calcul de 
scores de pertinence) avec 

o H=K 

o A~R 

o K=K C 

o T=R X 

5. Soit P N la page de R, pas encore dans K c , qui a le score de pertinence le plus €leve. Si son 
score de pertinence est inf6rieur & un score minimal fix6, retourner au point trois. (le 
noyau courant est maintenant complet). Sinon Fins6rer dans Kc et repasser au point 
quatre> A noter qu'il ne sera pas n€cessaire de r€initialiser les scores pivot et autoritg, il 
est pr6f6rable de garder les derni&res valeurs calcul6es, ainsi la convergence devrait Stre 
tr^s rapide. 



28 (que ce soit de maniere absolue ou par rapport & la requSte) 

29 Dans le cas oil on a les scores autorite* des pages, ou autre score de popularity, on prdfere se baser plutot sur eux. 
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6. 



On a maintenant un ensemble de noyaux (sous-requ6tes homogenes par l'amont) pr&es a 
etre utilisees comme decrit dans ce document. Lorsqu'on veut calculer Ies scores de 
pertinence globalement a toute la requete on fait une moyenne arithm6tique des resultats 
pour chacun des noyaux. 



Au lieu de se baser sur I' equation d'homogeneite" x s =JJp P ( ~ lP comme ddcrit jusqu'ici, le 



proce'de' de calcul de scores de pertinence peut etre base - sur une autre equation d' homogeneity, 
comme par exemple x s 



ou encore x s = 



P f eS 



P<eS 



( Min\m)\ 

P,eS 



Mcuc\B{Pd\ 



dans lesquelles 



les cardinalites d'ensemble (representees entre barres verticales) sont remplacees par le total des 
scores hub des pages en question . 

Cadre general pour le traitement par I'aval > 

Am hen de chercher les bonnes pages relativement a celles d'un noyau parmi les pages qui sont 
citees en commun avec elles il peut 6tre interessant d'effectuer les m6mes algorithmes dans 
1 autre sens, i.e. en cherchant parmi les pages qui citent les memes pages que le noyau, voire 
meme d effectuer les deux et de calculer une moyenne arithm&ique. 

Les algorithmes par I'aval sont identiques a ceux par 1* amont sauf que B est remplac6 par F et F 
estremplac6parB,efestintervertiavec + (eg./r + est remplac6 par R+~). 

Attribution de pages « artifscielies » 

Les process par l'amont et par I'aval peuvent 8tre avantageusement integres de la maniere 
suivante : Apres le traitement par l'amont (eventuellement mSme apres chaque iteration amont) 
aux pages candidates {R ) ayant obtenu un score de pertinence suffisant, on associe a I'aval un 
ensemble de pages supplemental (« pages artificielles ») dont la cardinality est fonction dudit 
score de pertinence Chaque page artificielle est aussi citee par (au moins) une page de la requSte 
On donne ainsi a 1 aval un « avantage » aux scores de ces bonnes pages (de trouvees par 
JS? • / 6 ! par cons ^ uent on donne aussi indirectement un avantage aux scores des pages (de 
" ) citees le cas echeant par ces bonnes pages. 

Et r&iproquement, apres le traitement par I'aval (eventuellement m6me apres chaque iteration 
aval), on applique a l'amont le m6me proc€d6 de maniere sym&rique. On favorise ainsi les 
bonnes pages de R ' et indirectement les pages (de R' + ) qui les citent le cas 6ch€ant. 

Le fait de ne pas amalgamer les scores par l'amont (des pages /T) avec les scores par I'aval 
(pages R ) permet de les dissocier dans les calculs. Notamment, on peut diminuer l'influence des 
scores obtenus par I'aval dans les traitements par l'amont ou vice-versa 



* qU ? remplaCe ICS ca f dinaUt& de * « cardinality ponderes », les poids etont les scores hub. 

Noter que, avantageusemeni, ceci se fait sans amalgamer les scores de pertinence par l'amont et par I'aval. 
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Par ailleors grace a cette idee de « pages artificielles », le present proced* peut etre appfiqufe en 
citantes et citees avant d'appliquer ces methodes. 

rapport a la requete. 

Arp®ni@rle Web recursiv&ment 

^ k mesure «h lfiS pages avant les meilleurs scores sont censees toe ^ Pertinentes » pour 



On pent ainsi arpenter le Web a partir de la requete de 1 utilisateur. 
La figure 7 presente de maniere schematique un tel procede : la 

peuX ap^liquee recurrent en ^^^SSTw ^£X£2t£ 



cessent d'etre suffisants. 
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REVENDICATIONS 



1. Precede pour permettre l'acces par un utilisatevir a des d'entites d' informations 
pertinentes a partir d'une entite d'infonnations de depart, chaque entite d'informations etant 
accessible par un identifiant (URI), caracterise en ce qu'il comprend les etapes suivantes : 

a) pr6voir au moins une entite d'informations similaire, presentant un contenu similaire a 
celui de 1' entite" de depart, et determiner l'identifiant de la ou de chaque entite" d'infonnations 
similaire, et 

b) determiner a partir du ou de chaque identifiant d'entite d'informations similaire un 
ensemble d'un ou plusieurs identifiants d'entites d'informations pertinentes par rapport a la ou 
chaque entite d'informations similaire. 

2. Precede selon la revendication 1, caracterise en ce qu'il comprend en outre l'etape 
suivante : 

c) permettre k l'utilisateur Tacc^s a au moins certaines informations pertinentes a partir de 
leurs identifiants respectifs. 

3. Procede selon la revendication 1 ou 2, caracterise en ce qu'il comprend en outre l'etape 
suivante : 

d) a partir des identifiants d'entites d'informations pertinentes et d'un ensemble donne 
d'entites d'informations suppiementaires, seiectionner les entites suppiementaires les plus 
similaires aux entites d'informations pertinentes. 

4. Procede selon l'une des revendications 1 a 3, caracterise en ce qu'il comprend une etape 
suppiementaire de tri des entites d'informations pertinentes par degre de pertinence. 

5. Precede selon la revendication 4, caracterise en ce que l'etape de tri est pr6cedee d'une 
etape de calcul d'un score de pertinence par rapport a la ou chaque entite d'informations 
similaires pour chacune des entites d'informations pertinentes. 

6. Proced6 selon l'une des revendications 1 a 5, caracterise en ce que chaque entite 
d'informations est constimee par un fragment de page ecrite en langage de marquage normahse, 
ou par une telle page dans son ensemble. 

7. Procede selon la revendication 6, caracterise en ce que chaque identifiant est consume par 
un identificateur uniforme de ressource (URI) du fragment ou de la page. 

8. Procede selon l'une des revendications 1 a 7, caracterise en ce que l'etape a) est realisee 
par selection par l'utilisateur d'une ou plusieurs entites d'informations similaires a l'entite" 
d'informations de depart 

9. Procede selon l'une des revendications 1 a 7, caracterise en ce que l'etape a) est realisee 
par mise en oeuvre d'un processus de determination automatique d'entites d'informations 
similaires. 

10. Procede selon l'une des revendications 1 a 7, caracteris6 en ce que l'etape a) est realisee 
par mise en oeuvre d'un processus de determination automatique d'entites d'informations 
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similaires, suivie d'une selection par l'utilisateur d'une ou plusieurs entites d> informations 
similaires parmi les entites d' informations similaires determines par ledit processus. 

1 1 Procede selon 1'une des revendications 1 a 10, caracterise en ce que l'ftapeb) est realisee 
par mise en oeuvre d'un processus de determination automatique d'entites d informations 
pertinentes. 

12 Procede selon la revendication 11, caracterise en ce que le processus de determination 
automatique d'entites deformations pertinentes comprend 1'analyse d'une structure de graphe 
d'identifiants constitute par les identifiants d'entites d' informations et par les identifiants 
designes par des liens activables par Futilisateur contenus dans Iesdites entites d informations. 

1i Proced6 selon la revendication 12, caracterise en ce que le processus de aetermmauon 
automatique d'entites d' informations pertinentes comprend les operations suivantes : 

bl) identifier un ensemble d'entites d' informations citantes constijie par toutes les entites 
d'informations possedant un lien d6signant l'identifiant de l'entite d' informations similaire ou 
d'au moins l'une des entites d' informations similaires, ..^ , lp 

b2) identifier un ensemble d'entites d'informations candidates constitue par 1 ensemble 
des entites d'informations dont les identifiants sont designer dans d'autres liens contenus dans les 
entites d'informations citantes, „ t - t x 

b3) pour chaque entite d'informations candidate, calculer un score de pertinence d entite 
^informations candidate entre ladite entite d'informations candidate et Ventitf d informanons 
similaire ou l'ensemble d'entites d'informations similaires, sur la base de , I 'existence dans les 
entit6s d'informations citantes prises individuellement, a la fois d'un ^ "W^. 1 *"^ 
de l'entit6 d'informations candidate et d'un Ben designant l'identifiant de l'entit6 d ^formations 
similaire ou les entites d'informations similaires, et sur la base 6galement de scores de pertinence 
d'entite d'informations citante affectes a chacune des entites d'informations citantes, 

b4) pour chaque entite d'informations citante, recalculer un score de pertinence d entite 
d'informations citante sur la base de l'existence, dans l'entite d'informations citante en question 
de liens vers les entity d'informations candidates et sur la base egalement des score* de 
pertinence d'entit6 d'informations candidate attribuees aux entites d'informations candidates a 

l etaPe b5) r6peter le cas 6ch6mt l'etape b3) et le cas echeant une ou plusieurs fois l'6tape b4) 
puis l'6tape b3), pour toutes les entites d'informations candidates et citantes, et 

b6) determiner Iesdites entites d'informations pertinentes comme 6tant les entity 
d'informations candidates qui presentent les meiUeurs scores de pertinence d entite 
d'informations candidate. 

14 Procede selon la revendication 12, caracterise en ce que le processus de determination 
automatique d'entites d'informations pertinentes comprend les operations suivantes : 

bl) identifier un ensemble d'entites d'informations citees constitue par toutes les entites 
d'informations identifiees dans des liens activables contenus dans l'entite d informations 
similaire ouau moins l'une des entites d'informations similaires, 

tf>) former un ensemble d'entites d'informations candidates constitue par 1 ensemble des 
autres entites d'informations ayant des liens activables identifiant Iesdites entites citees, 

b3) pour chaque entite d'informations candidate, calculer un score de pertinence d entite 
d'informations candidate entre ladite entit6 d'informations candidate et l'entite d informations 
similaire, ou l'ensemble d'entites d'informations similaires, sur la base de 1 existence de liens 
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activables contenus dans 1' entite d'informations candidate et dans le ou les entites d'informations 
similaire(s) et identifiant les entites d'informations citees, et sur la base 6galement de scores de 
pertinence d'entite d'informations citee affectes a chacune des entites d'informations citees, 

M) pour chaque entite d'informations citee, recalculer un score de pertinence d'entite" 
d'informations citee sur la base de l'existence, dans 1' entite d'informations citee en question, de 
liens activables identifiant cette entity d'informations citee et contenus dans les entites 
d'informations candidates et sur la base egalement des scores de pertinence d' entity 
d'informations candidate attributes aux entites d'informations candidates a l'ttape b3), 

b5) repeter le cas echeant l'ttape b3) et le cas echeant une ou plusieurs fois l'ttape b4) 
puis 1* etape b3), pour toutes les entites d' informations candidates et citees, et 

b6) determiner lesdites entites d'informations pertinentes comme etant les entites 
d'informations candidates qui presentent les meilleurs scores de pertinence d'entite 
d'informations candidate. 

15. Proctdt selon la revendication 13, caracterist en ce que le calcul de score de pertinence 
effectut a 1'ttape b3) comprend le calcul d'une plurality de sommes de scores de pertinence 
d' entites d'informations citantes, chaque somme comprenant uniquement les scores de 
pertinences des entites d'informations citantes comprenant un lien vers une entite d'informations 
donnee constitute par 1' entite" d'informations candidate ou une entite d'informations similaire. 

16. Proctdt selon la revendication 15, caracterist en ce qu'il comprend tgalementie calcul 
d'au moins une somme de scores de pertinence d' entites d'informations citantes, chaque somme 
comprenant uniquement les scores de pertinence des entites d'informations citantes comprenant 
un lien vers l'une parmi un ensemble d'au moins deux entites d'informations donnees 
comprenant l'entite d'informations candidate et au moins une entite d'informations similaire. 

17. Proctdt selon l'une des revendications 1 a 16, caracterist en ce que T entite" 
d'informations de depart est accessible par l'utilisateur et en ce que l'etape b) comprend la prise 
en compte d'informations sptcifiques a l'utilisateur. 

18. Proc&te selon la revendication 17, caracterist en ce que les informations specifiques a 
l'utilisateur comprennent des identifiants d'entites d'informations memorises dans un historique 
de consultation d'entites d'informations par l'utilisateur. 

19. Proc&te selon la revendication 2 ou l'une des revendications 3 a 18 prise dans la 
dependance de la revendication 2, caracterist en ce qu'il comprend en outre une etape de 
presentation a l'utilisateur, de maniere associee, d'au moins deux elements choisis dans le groupe 
comprenant : 

- une presentation de 1' entite d'informations de depart 

- un lien activable designant 1' identifiant de 1' entite" de depart ; 

- des presentations des entites d'informations pertinentes dttermhtees a 1'ttape c) ; 

- des liens activables designant les identifiants des entites d'informations pertinentes 
dttermintes a l'ttape c). 

20. Proctde selon la revendication 3 ou l'une des revendications 4 a 18 prise dans la 
dependance de la revendication 3, caracterise" en ce qu'il comprend en oulre la presentation a 
l'utilisateur, de maniere associee, d'au moins deux elements choisis dans le groupe comprenant : 

- une presentation de Tentite d'informations de depart ; 
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- un lien activable designanl l'identifiant de 1' entite d' informations de depart ; 

- des presentations des entiles d' informations supplementaires les plus similaues 

4&aai ^ k V^Mtat» udlisant les identifies des entites ^informations supplementaires 
les plus similaires determinees a 1'etape d). 

n Precede de composition ou de modification d'un ensemble d'informations contenant la 
designation d'une entite d'informations de depart donnee, caracterise en ce qu il comprend les 

etapes su ™^ ^ ^ e le proc , d6 gelon la revendication 3 sur ladite entite de depart pour 
determiner une ou plusieurs entites d'informations supplementaires les plus similaires, et 

sutetituer a la ^oi gnati™ He rentite de depart la designation d au moms 1 une des 



entites supplementaires les plus similaires. 

T> Procede selon la revendication 21, caracterise en ce que l'ensemble d'informations 
p^ssede une structure comprenant un arbre avec au moins un nceud au niveau '^11* 
designation d'une entite d'informations de depart est effectuee, et en ce qu'une mise en ceuvre du 
proc6de selon la revendication 3 au niveau de ce nceud comprend a 1'etape b) la prise en compte 
d'identifiants d'entites d'informations pertinentes associes a au moms un noeud ancetre de ce 
nceud dans 1' arbre. 

23 Procede d'execution variable d'un programme d'afflchage de donnees comportant des 
operations de lecture de donnees de nceuds dans une structure arborescente de donnees assoc^e 
caracterise en ce que la structure de donnees comprend, en association avec des nceuds dont les 
donnees sont modifiables par l'utilisateur dans un mode administration, des indicateurs, et en ce 
que le procede comprend les etapes suivantes : . 

- a chaque lecture d'une donnee dans le structure de donnees, determination, par le 
programme d'affichage,de la presence d'un indicateurassocie, . 

- en cas de presence d'un tel indicateur, affichage d'eiements graphiques mteractifs 
permettant h. l'utilisateur de manipuler la donnee associee. 

04 Procede d' execution variable d'un programme d'afflchage de donnees comportant des 
operations de lecture de donnees de nceuds dans une structure arborescente de donnees associee, 
caracterise en ce que programme comprend des instructions de lecture et de presentation de 
donnees correspondant a des nceuds seiectionnes, et en ce qu'il comprend les etapes suivantes : 

- determiner si un parametre d'appel de l'execution du programme d affichage correspond 

a un mode administration, . 

- dans l'affirmative, a chaque lecture d'une donnee dans la structure de donnees, 
determiner par le programme d'afflchage, la presence d'un indicateur associe a cette lecture, et 

- en cas de presence d'un tel indicateur, afficher des elements graphiques mteractifs 
permettant a l'utilisateur de manipuler la donnee associee. 

25 Precede pour determiner des scores de pertinence d'unites de texte telles que des phrases 
dans un document textuel, caracterise en ce qu'il comprend les etapes suivantes : 

- decomposition du document en une pluralite d'unites de texte, 

- selection d'au moins une unite de texte pertinente et d'unites de texte candidates, 

- determination de l'ensemble des mots signifiants contenus dans l'umte (ou les unites) de 
texte pertinente(s) et dans chacune des unites de texte candidates, 
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- pour chaque mot signifiant contenu dans 1' unite (ou les unites) de texte pertinente(s) 
identification des unites de texte candidates citant ce mot signifiant, pour former un groupe 
d'unites de texte citantes, 

- identification des unites de texte candidates contenant au moins un mot signifiant 
egalement cite dans les unites de texte citantes, pour former un groupe d'unites de texte co-citees, 

- affectation aux unites de texte co-citees un score de pertinence en fonction desdites 
citations. 



26. Proc6d<5 pour determiner des scores de pertinence d'unites de texte telles que des phrases 
dans un document textuel, caracterise" en ce qu'il comprend les etapes suivantes : 

- decomposition du document en une plurality d'unites de texte, 

- selection d'au moins une unite" de texte pertinente et d'unites de texte candidates, 

- determination de l'ensemble des mots signifiants contenus dans l'unite (ou les unites) de 
texte pertinente(s) et dans chacune des unites de texte candidates, 

- pour chaque mot signifiant contenu dans l'unite (ou les unites) de texte pertinente(s), 
identification des unites de texte candidates comprenant ce mot signifiant, pour former un groupe 
d'unites de texte cites, " 

- identification des unites de texte candidates contenant au moins un mot signifiant 
egalement cite dans les unites de texte cites, pour former un groupe d'unites de texte co-citantes, 

- affectation aux unites de texte co-citantes un score de pertinence en fonction desdites 
citations. 

27. Proc&te pour determiner des scores attribues a des mots ou groupes de mots contenus 
dans des unites de texte telles que des phrases dans un document textuel, caracterise" eh ce qu'il 
comprend une etope qui consiste a additionner les scores de pertinences, determines selon 1'une 
des revendications 25 et 26, des unites de texte co-citees dans lesquels lesdits mots se trouvent 
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